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La revisión de este libro de texto ha sido un desafío especial por una razón bastante agra¬ 
dable. Mucha gente ha leído este libro, enseñado a partir de él e inclusive lo ha querido. 
Quizá el espíritu del libro no cambie jamás. Este texto fue escrito como ayuda para que 
nuestra enseñanza del álgebra lineal mantenga la importancia crucial de este tema, que si¬ 
gue creciendo. 

Ciertamente, un paso era posible y aconsejable: añadir nuevos problemas. Tantos años 
de enseñanza requirieron cientos de reactivos de examen nuevos (especialmente con inte¬ 
rrogantes que impliquen el uso de la red). Considero que el lector aprobará la amplia gama 
de problemas. Los reactivos siguen siendo una mezcla de explicación y cálculo: los dos 
métodos complementarios para aprender este hermoso tema. 

Personalmente considero que mucha más gente necesita álgebra lineal que cálculo. 
¡Isaac Newton podría no estar de acuerdo! Sin embargo, él no está enseñando matemáticas 
en el siglo XXI (y quizá no fue un gran profesor, aunque le otorgaremos el beneficio de la 
duda). Cier tame nte, las leyes de la Física se expresan bien mediante ecuaciones diferencia¬ 
les. Newton requirió del cálculo, lo cual está bien. Pero el alcance de la ciencia, la ingenie¬ 
ría y la administración (así como de la vida) actualmente es mucho más grande, y el álgebra 
lineal se ha desplazado a un sitio nodal. 

Podría decir algo más, ya que muchas universidades aún no ajustan el equilibrio hacia 
el álgebra lineal. Al trabajar con líneas curvas y superficies curvas, el primer paso siempre 
es linealizar. Sustituir la curva por su recta tangente, ajustar la superficie por un plano y 
entonces el problema se vuelve lineal. El poder de este tema se hace evidente cuando se 
tienen 10 variables, o 1000, en vez de dos. 

Quizá el lector piense que estoy exagerando cuando uso la palabra “hermoso” para un 
curso básico de matemáticas. En absoluto. Este curso empieza con dos vectores v y uj que 
apuntan en direcciones distintas. El paso clave es tomar sus combinaciones lineales. Se mul¬ 
tiplica para obtener 3v y 4ui, y se suma para obtener una combinación particular 3v + 4w. 
Este nuevo vector está en el mismo plano que v y w. Cuando se toman todas las combina¬ 
ciones, se está llenando todo el plano. Si v y w se dibujan en esta página, sus combinacio¬ 
nes cv + dxu llenan la página (y más allá), pero no salen de la página. 

En el lenguaje de las ecuaciones lineales, cv + dw = b puede resolverse exactamen¬ 
te cuando el vector b está en el mismo plano que v y w. 


Matrices 

Se avanzará un poco más para convertir combinaciones de vectores tridimensionales al 
álgebra lineal. Si los vectores son v = (1, 2, 3) y w = (1, 3, 4), se escriben en una matriz 
columna: 


matriz 


1 1 

2 3 

3 4 
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Para encontrar combinaciones de estas columnas, la matriz se “multiplica” por un vector 
(c, dy. 


Combinaciones lineales cv + dw 


1 1 
2 3 



Estas combinaciones llenan un espacio vectorial , denominado espacio columna de la ma¬ 
triz. (Para estas dos columnas, dicho espacio es un plano.) Para decidir si b — (2, 5, 7) es¬ 
tá en ese plano, se cuenta con tres componentes para lograrlo. Así, hay que resolver tres 
ecuaciones: 



2] c + d = 2 

5 significa 2c + 3d = 5 
7J 3c + 4d = 7. 


Se deja que el lector las resuelva. El vector b = (2, 5, 7) no está en el plano de v y w. Sí 
el 7 se cambia por cualquier otro número, entonces b no está en el plano; de hecho, no es 
ninguna combinación de v y w, por lo que las tres ecuaciones no tienen solución. 

Ahora es posible describir la primera parte del libro, sobre ecuaciones lineales Ax = 
b. La matriz A tiene n columnas y m renglones. El álgebra lineal se desplaza de manera 
continua hacia n vectores en el espacio m-dimensional. Siguen buscándose combinaciones 
de las columnas (en el espacio columna). Siguen obteniéndose m ecuaciones para producir 
b (una por cada renglón). Estas ecuaciones pueden o no tener una solución. Siempre tienen 
una solución por mínimos cuadrados. 

La interacción de las columnas y los renglones constituye el núcleo del álgebra lineal. 
No es totalmente fácil comprenderlo, aunque tampoco es tan difícil. A continuación se enu¬ 
meran cuatro de los conceptos más importantes: 

1. El espado columna (todas las combinaciones de las columnas). 

2. El espado renglón (todas las combinaciones de los renglones). 

3. El rango (el número de columnas independientes) (o renglones). 

4. Eliminación (la forma idónea para encontrar el rango de una matriz). 

Y aquí me detengo para permitirle iniciar el curso. 


Páginas web 

Quizá sea útil mencionar las páginas de la red conectadas con este libro. Recibimos 
muchos mensajes con sugerencias y palabras de aliento, por lo que espero que el lector 
utilice todo con libertad. Puede acceder directamente a http://web.mit.edu/18.06, que se ac¬ 
tualiza constantemente para el curso que se imparte cada semestre. Álgebra lineal también 
está en el sitio del MIT OpenCourseWare http://ocw.mit.edu, donde 18.06 se volvió excep¬ 
cional al incluir videos de las conferencias (que, por supuesto, usted no tiene que ver...). 
A continuación se menciona una parte del material disponible en la red: 

1. Programa de conferencias y tareas y exámenes actuales con soluciones. 

2. Los objetivos del curso, así como preguntas conceptuales. 

3. Demos interactivos Java (ahora ya se cuenta con audio para los valores característi¬ 
cos). 

4. Códigos de enseñanza del álgebra lineal y problemas MATLAB. 

5. Videos de todo el curso (tal y como se enseña en un aula real). 

La página del curso se ha convertido en un vínculo valioso para la clase y un recurso para 
los estudiantes. Estoy bastante optimista sobre el potencial de las gráficas sonoras. El an¬ 
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cho de banda para la voz en off es bajo, y FlashPlayer está disponible de manera gratuita. 
Esto ofrece un repaso rápido (con experimentos activos), y es posible bajar todas las con¬ 
ferencias. Espero que los profesores y estudiantes de todo el mundo encuentren útiles es¬ 
tas páginas web. Mi objetivo es hacer este libro lo más útil posible con todo el material del 
curso que puedo proporcionar. 

Mota importante: La administración de estas páginas Web y de otras mencionadas dentro 
del libro no está a cargo de Thomson Leaming Iberoamérica, por lo que la editorial no es 
responsable de las modificaciones en el contenido y los cambios en las políticas y formas 
de acceso que pudieran ocurrir. Le recomendamos visitar frecuentemente estos sitios a fin de 
estar al tanto de cualquier actualización. 

Complementos 

Este libro cuenta con complementos para el profesor, los cuales están en inglés y sólo se 
proporcionan a los docentes que adopten la presente obra como texto para sus cursos. Pa¬ 
ra mayor información, favor de comunicarse con las oficinas de nuestros representantes o 
a los siguientes correos electrónicos: 

Thomson México y Centroamérica clientes@thomsonleaming.com.mx. 

Thomson América del Sur cliente@thomsonleaming.com 
Thomson Caribe amy.reyes@thomsonleaming.com 

Estructura del curso 

Los dos problemas fundamentales son Ax — b y Ax — Xx para matrices cuadradas A. El 
primer problema Ax = b tiene una solución cuando las columnas de A son independientes. 
El segundo problema Ax = Ex es para vectores característicos independientes. Una parte 
crucial de este curso es aprender el significado de “independencia”. 

Considero que la mayoría de nosotros aprendemos primero a partir de ejemplos. Pue¬ 
de ver que 

'1 1 2l 

^ | 2 3 no tiene columnas independientes. 

1 3 4_ 

La columna 1 más la columna 2 es igual a la columna 3. Un teorema maravilloso del álge¬ 
bra establece que los tres renglones tampoco son independientes. El tercer renglón debe 
estar en el mismo plano que los dos primeros renglones. Con alguna combinación de los 
renglones 1 y 2 se obtiene el renglón 3. Quizá el lector pueda encontrar rápidamente esta 
combinación (yo no pude). Al final tuve que usar eliminación para descubrir que la com¬ 
binación correcta utiliza 2 veces el renglón 2, menos el renglón 1. 

La eliminación es la forma simple y natural para entender una matriz al producir bastan¬ 
tes elementos iguales a cero. Por tanto, el curso empieza aquí. ¡Pero no se quede demasiado 
aquí! El lector debe proceder de combinaciones de ios renglones a independencia de los 
renglones a la “dimensión del espacio renglón”. Este es el objetivo clave, abordar todos 
los espacios de los vectores: el espacio renglón, el espacio columna y el espacio nulo. 

Otro objetivo es comprender la manera en que actúa la matriz. Cuando A se multipli¬ 
ca por x se obtiene el nuevo vector Ax. Todo el espacio de vectores se mueve; es transfor¬ 
mado” por A. Transformaciones especiales se obtienen de matrices particulares, y aquellas 
son las primeras piedras del álgebra lineal: matrices diagonales, matrices ortogonales, ma¬ 
trices triangulares, matrices simétricas. 
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Los valores característicos de estas matrices también son importantes. Considero que 
las matrices de 2 por 2 constituyen ejemplos contundentes de la información que pueden 
proporcionar los valores característicos X. Las secciones 5.1 y 5.2 ameritan una lectura cui 
dadosa para ver la manera en que Ax = Xx es de utilidad. Ahí se presenta un caso en que 
matrices pequeñas permiten la obtención de muchísimo conocimiento. 

En forma global, la belleza del álgebra lineal puede apreciarse de varias maneras: 

1. Visualización. Combinación de vectores. Espacios de vectores. Rotación reflexión 
y proyección de vectores. Vectores perpendiculares. Cuatro subespacios fundaméntales. 

2. Abstracción. Independencia de vectores. Base y dimensión de un espacio vectorial 
Transformaciones lineales. Descomposición del valor singular y la mejor base. 

3 ' , Cáku '°- Eliminación para producir elementos cero. Gram-Schmidt para producir 
ferencTi característicos para resolver ecuaciones diferenciales y en di- 

4. Aplicaciones Solución por mínimos cuadrados cuando Ax = b tiene demasiadas 
ecuaciones Ecuactones en diferencias que aproximan ecuaciones diferenciales Matící 

de probabilidad de Markov (¡la base para Google!). Vectores característicos ortogonales 
como ejes principales (y más .. .). rtogonates 

Para continuar con estas aplicaciones, se mencionan los libros publicados por Welles- 
ey ambndge Press. Todos aparentan ser de álgebra, aplicados al procesamiento de seña 
les, a ecuaciones diferenciales parciales y a cálculos científicos (e inclusive GPS- Sistema 
de Posicionamiento Global). Si el lector consulta la página http.Y/www.wellesleycambride 
com, verá parte de la razón por la que el álgebra lineal es tan utilizada 

. . D “ PUÍ ; S de este P refaci0 ’ el libro Oblará por sí mismo. De inmediato observará el es 
pmtu. El énfasis se pone en la comprensión: intento explicar, más que deducir. Este es un 

t°h^ e matematlcas verd aderas, no un ejercicio interminable. En clase, constantemen¬ 
te trabajo con ejemplos para enseñar lo que necesitan los estudiantes. 

Agradecimientos 

Disfrute la redacción de este libro, y ciertamente espero que el lector disfrute leyéndolo 
Mucho de este placer proviene por haber trabajado con amigos. Recibí una ayuda mara 
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r,p,d„3 par. maW^ gnmte. Todos poedeo ote. J„ r 

curso. Hubiera podido añadir “Factorización” a la lista anterior, como una quinta avenida 
para la comprensión de las matrices: 4 mda 

[L'U’P] = l u (A) para ecuaciones lineales 
te’p] I qr ^ para hacer orto g°nales a las columnas 

15, Ej - eig(A) Para encontrar vectores característicos y valores característicos. 

Al dar las gracias, nunca me olvido de la primera dedicatoria de este libro hace años 
Aque la fue una oportunidad especial para agradecer a mis padres por haberme’ pZo^o- 
nado antos presentes generosos. Su ejemplo es una inspiración en mi vida. 
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M 1.1 INTRODUCCIÓN 

Este libro empieza con el problema central del álgebra lineal: la solución de ecuaciones li¬ 
neales. El caso más importante, y el más sencillo, es cuando el número de incógnitas es igual 
al número de ecuaciones. Se tienen n ecuaciones en n incógnitas, empezando con n = 2: 

Dos ecuaciones lx + 2y — 3 ^ 

Dos incógnitas 4x + 5y = 6. 

Las incógnitas son x y y. Para resolver estas ecuaciones requiero, describir dos métodos el 
de eliminación y el de determinantes. Ciertamente, x y y están determinadas por los núme¬ 
ros 1, 2, 3, 4, 5, 6. La cuestión es cómo utilizar estos seis números para resolver el sistema. 

1. Eliminación De la segunda ecuación, réstese 4 veces la primera ecuación. Así se eli¬ 
mina x de la segunda ecuación, y queda una ecuación para y: 

(ecuación 2) — 4(ecuación 1) — 3v = —6. (2) 

De inmediato se sabe que y — 2. Luego, x se conoce a partir de la primera ecuación, 
lx + 2y = 3: 

Con sustitución hacia atrás lx + 2(2) = 3 se obtiene x = — 1. (3) 

Procediendo cuidadosamente, se comprueba que x y y también resuelven la segunda 
ecuación. Esto debe funcionar, como es el caso: 4 veces (x — —1) más 5 veces (y = 2) 
es igual a 6. 

2. Determinantes La solución y = 2 depende completamente de los seis números en 
las ecuaciones. Debe haber una fórmula para y (y también para x). Se trata de una “razón 
de determinantes”, que espero, el lector me permita escribir directamente: 


1 

3 



4 

6 

1 -6-3-4 

_ ~ 6 

1 

2 

1 • 5 -2 • 4 

-3 

4 

5 
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Lo anterior puede parecer algo misterioso, a menos que el lector ya conozca algo sobre de¬ 
terminantes de 2 por 2. Estos determinantes proporcionan la misma respuesta y = 2, pro¬ 
veniente de la misma razón de -6 a -3. Si nos quedamos con los determinantes (lo cual no 
pensamos hacer), hay una fórmula semejante para calcular la otra incógnita, x: 

3 2 
6 5 
1 2 

4 5 

A continuación se compararán ambos métodos, pensando en futuros problemas reales 
en los que n es mucho más grande (n = 1000 es un tamaño bastante moderado en cálculos 
científicos). Lo cierto es que el uso directo de la fórmula de los determinantes para 1000 
ecuaciones puede ser un desastre total, ya que el millón de números a la izquierda se utiliza¬ 
ría correcta pero ineficazmente. Esta fórmula se encontrará en el capítulo 4 (regla de Cramer), 
aunque en el capítulo 1 se presenta un método aceptable para resolver 1000 ecuaciones. 

Este método aceptable es la eliminación gaussiana. Se trata del algoritmo que suele 
aplicarse de manera constante para resolver grandes sistemas de ecuaciones. A partir de los 
ejemplos en un libro de texto (n = 3 se aproxima al límite superior de la paciencia del au¬ 
tor y del lector), quizá el lector no puede apreciar mucha diferencia. En las ecuaciones (2) 
y (4) se siguieron esencialmente los mismos pasos para encontrar y = 2. Ciertamente, x se 
conoció más rápido por la sustitución hacia atrás en la ecuación (3) que la razón en (5). Pa¬ 
ra n más grande, no hay caso. Gana la eliminación (e incluso este método es el mejor para 
calcular determinantes). 

La idea de eliminación es engañosamente simple: el lector la dominará luego de unos 
cuantos ejemplos. Constituye la base de la mitad de este libro, simplificando una matriz de 
modo que sea posible comprenderla. Junto con la mecánica del algoritmo, en este capítulo 
es necesario explicar cuatro aspectos más profundos. Éstos son: 

1. Las ecuaciones lineales llevan a la geometría de planos. No es fácil visualizar un pla¬ 
no nueve-dimensional en un espacio de diez dimensiones. Es más difícil ver diez de es¬ 
tos planos, que se cortan en la solución de diez ecuaciones, aunque de alguna manera 
esto es casi posible. Nuestro ejemplo tiene dos rectas en la figura 1.1, que se encuen¬ 
tran en el punto (x, y) = (—1, 2). El álgebra lineal mueve esta imagen hacia diez di¬ 
mensiones, donde la intuición debe imaginar la geometría (y la obtiene correctamente). 

2. Pasamos a la notación matricial al escribir las n incógnitas como un vector x y las n 
ecuaciones como Ax = b. Multiplicamos A por “matrices de eliminación” con la fina¬ 
lidad de obtener una matriz triangular superior U. Con lo anterior, A se factoriza en L 
veces U, donde L es triangular inferior. 

y =^2^ ^^-2y = 3 
4x + 5y = 6 

Una solución (x, y) =(-1,2) Paralelas: no hay solución Recta completa de soluciones 

Figura 1.1 El ejemplo tiene una solución. Los casos singulares no tienen solución, o tie¬ 
nen demasiadas soluciones. 
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A continuación se escribirán A y sus factores para nuestro ejemplo, y se explicarán en 
su debido momento: 

Factorización A — 

Primero es necesario presentar las matrices, los vectores y las reglas de la multiplica¬ 
ción. Toda matriz tiene una traspuesta A T . Esta matriz, tiene una inversa A~ l . 

3. En la mayor parte de los casos, la eliminación se realiza sin dificultades. La matriz tie¬ 
ne una inversa, y el sistema Ax = b tiene una solución. En casos excepcionales el mé¬ 
todo falla', ya sea que las ecuaciones se escribieron en orden equivocado, lo cual se 
arregla fácilmente al intercambiarlas, o las ecuaciones no tienen una solución única. 
El caso singular aparece si 8 se sustituye por 5 en nuestro ejemplo: 


1 [1 01 fl 2] IT 

= [ 4 íj [o _ 3 J = L veces U. (6) 


Caso singular 
Dos rectas paralelas 


lx + 2y = 3 
4x + 8y = 6. 


(7) 


4. 


La eliminación resta simplemente 4 veces la primera ecuación de la segunda. Sin em¬ 
bargo, ¡observe el resultado! 


(ecuación 2) - 4(ecuación 1) 



Este caso singular no tiene solución. Otros casos singulares tienen una infinidad de 
soluciones. (Cambie 6 a 12 en el ejemplo, y la eliminación producirá 0 = 0. Así, y, 
puede asumir cualquier valor.) Cuando la eliminación falla, se quiere encontrar toda 
solución posible. 

Se requiere una estimación aproximada del número de pasos de eliminación necesa¬ 
rios para resolver un sistema de tamaño n. El costo de cómputo a menudo determina 
la precisión del modelo. Cien ecuaciones requieren alrededor de 300 000 pasos (mul¬ 
tiplicaciones y restas). La computadora es capaz de hacer estos pasos rápidamente, pe¬ 
ro no es así para el caso de varios billones de pasos. Y después de un millón de pasos, 
el error por redondeo puede ser significativo. (Algunos problemas son sensibles; otros 
no.) Sin entrar en todos los detalles, pretendemos considerar grandes sistemas que se 
presentan en la práctica, así como la manera en que se resuelven realmente. 


El resultado final de este capítulo, es un algoritmo de eliminación que es casi lo más 
eficaz posible. Se trata del algoritmo que suele usarse en una numerosa variedad de aplica¬ 
ciones. Y al mismo tiempo, comprenderlo en términos de matrices —la matriz de coeficien¬ 
tes A, las matrices E y P para la eliminación e intercambio de renglones, respectivamente, 
y los factores finales L y U — es un fundamento esencial de la teoría. Espero que el lector 
disfrute este libro y su curso. 


1.2 GEOMETRÍA DE LAS ECUACIONES LINEALES 

La forma de comprender este tema es mediante un ejemplo. Se empieza con dos ecuacio¬ 
nes extremadamente simples, reconociendo que el lector puede resolverlas sin necesidad 
de llevar un curso de álgebra lineal. No obstante, espero que le dé una oportunidad a Gauss: 

2x — y = 1 
x + y = 5. 

Este sistema puede abordarse por renglones o por columnas. Queremos abordarlo en am¬ 
bas formas. 
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El primer método se centra en las ecuaciones por separado (los renglones). Es el más 
conocido, y en dos dimensiones se hace rápidamente. La ecuación 2x - y = 1 se represen¬ 
ta por una linea recta en el plano x-y. La recta pasa por los puntos r = l,j = jy^ = 1 
yj= 0 (y también por (2, 3) y todos los puntos intermedios). La segunda ecuación x + y ' 
- 5, produce una segunda recta (véase la figura 1.2a). Su pendiente es dy/dx = -1 y cor¬ 
ta a la primera recta en la solución. 3 

El punto de intersección pertenece a ambas rectas. Se trata de la única solución de las 
dos ecuaciones. El punto x = 2yy = 3se encontrará pronto por “eliminación”. 




/y _ 2 (columna 1) 

’ +3 (columna 2) 

(4,2) 

(2,1) = columna 1 


b) Las columnas se combinan con 2 y 3 

Figura 1.2 Representación por renglón (dos rectas) y representación por columna (se 
combinan columnas). 1 


El segundo método considera las columnas del sistema lineal. Las dos ecuaciones por 
separado en realidad son una ecuación vectorial: 

Forma de columna x 



'2' 


r-r 

fll 

* 

M 

+ y 

1J 



El problema consiste en encontrar la combinación de los vectores columna en el miembro 
izquierdo que produce el vector del miembro derecho. Los vectores (2 1) y ( -1 1) se re 
presentan con las líneas gruesas en la figura 1.2b. Las incógnitas son los números’x y y que 
multiplican a los vectores columna. Toda la idea puede verse en esa figura, donde 2 veces la 
co uitrna 1 se suma a 3 veces la columna 2. Geométricamente, así se obtiene un famoso pa- 
ralelogramo. Algebraicamente, se obtiene el vector correcto (1, 5), en el miembro derecho 
de las ecuaciones. La representación por columnas confirma que * = 2 y y = 3. 

_ f 1 !? 16 dedlcarse más tiempo a este ejemplo, aunque se prefiere pasar al caso en que 
H 3 ' Tres ecuaci °nes siguen siendo manipulables, y presentan mucha mayor variedad: 


Tres planos 


2u + v + w = 5 

4 u — 6v = —2 

-2u + Iv + 2w = 9. 


( 1 ) 


De nuevo, es posible estudiar los renglones o las columnas, de modo que se empieza con los 
renglones. Cada ecuación describe un plano en tres dimensiones. El primer plano es 2 u + 
v + w ~ 5 ’ y . se muestra en la figura 1.3. Contiene a los puntos ( § , 0, 0) y (0, 5, 0) y (0, 0 
5). Es determinado por cualesquiera tres de sus puntos, suponiendo que no son cólinealel ’ 
Al cambiar 5 a 10 , el plano 2u + v + w = 10 debe ser paralelo al anterior. Contie¬ 
ne a (5, 0, 0) y (0, 10, 0), y (0, 0, 10) que está dos veces más lejos del origen, que es el 



w 



Figura 1.3 La representación por renglón: tres planos que se cortan, provenientes de tres 
ecuaciones lineales. 

punto central u = 0, v = 0, w — 0. Al cambiar el miembro derecho, el plano paralelo se 
mueve a sí mismo, y el plano 2u + v + w = 0 pasa por el origen. 

El segundo plano es 4u — 6v = —2. Se trazó verticalmente porque w puede asumir 
cualquier valor. El coeficiente de w es cero, aunque sigue siendo un plano en el espacio 
tridimensional. (La ecuación 4u - 3, o incluso el caso extremo u = 0, sigue describien¬ 
do un plano.) En la figura se muestra la intersección del segundo plano con el primero. 
Esta intersección es una recta. En tres dimensiones, una recta requiere dos ecuaciones ; en 
n dimensiones requiere n - 1 . 

Finalmente, el tercer plano corta a la recta en un punto. El plano (no está dibujado) 
representa la tercera ecuación, —2 u + Iv + 2w = 9, y corta a la recta en u = 1, v = 1, 
w = 2. Este punto de intersección triple (1, 1,2) resuelve el sistema lineal. 

¿Cómo se extiende hasta n dimensiones esta representación por renglones? Las n ecua¬ 
ciones contienen n incógnitas. La primera ecuación sigue determinando un “plano”, que ya 
no es un plano bidimensional en el espacio tridimensional; de alguna manera, su “dimen¬ 
sión” es n — 1 . Debe ser plano y extremadamente delgado en un espacio «-dimensional, 
aunque nos parezca sólido. 

Si el tiempo es la cuarta dimensión, entonces el plano t = 0 corta al espacio tetradimen- 
sional y produce el universo tridimensional en que vivimos (o más bien, el universo como 
era en í = 0). Otro plano es z = 0, que también es tridimensional; se trata del plano normal 
x-y que se considera todo el tiempo. ¡Estos espacios tridimensionales se cortan! Comparten 
el plano normal x-y en t = 0. Si se desciende a dos dimensiones, el siguiente plano deja una 
recta. Por último, un cuarto plano deja un solo punto. Se trata del punto de intersección de 
4 planos en 4 dimensiones, y resuelve las 4 ecuaciones subyacentes. 

Si continuamos con este ejemplo proveniente de la relatividad, estaremos en proble¬ 
mas. La cuestión es que el álgebra lineal es capaz de operar con cualquier número de ecua¬ 
ciones. La primera ecuación produce un plano (« - 1) dimensional en n dimensiones. El 
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segundo plano lo corta (esperamos) un conjunto más pequeño de “dimensión n — 2”. Su¬ 
poniendo que todo va bien, todo plano nuevo (toda ecuación nueva) reduce la dimensión 
en una unidad. Al final, cuando se hayan tomado en cuenta todos los n planos, la dimen¬ 
sión de la intersección es cero. Se trata de un punto, que pertenece a todos los planos, y sus 
coordenadas satisfacen a todas las n ecuaciones. ¡Ésta, es la solución! 


Vectores columna y combinaciones lineales 


Ahora volvemos a las columnas. Esta vez la ecuación vectorial (la misma ecuación que (1)) 
es 


Forma de columna 


5 

-2 = b. 
9 


Estos son vectores columna tridimensionales. El vector b se identifica con el punto cuyas 
coordenadas son 5, —2, 9. Todo punto en el espacio tridimensional se hace corresponder 
con un vector, y viceversa. Ésta, era la idea de Descartes, quien transformó la geometría en 
álgebra al trabajar con las coordenadas del punto. Es posible escribir el vector en una co¬ 
lumna, o sus componentes pueden enumerarse como b = (5, —2, 9), o incluso puede re¬ 
presentarse geométricamente mediante una flecha a partir de su origen. Pueden elegirse la 
flecha, o el punto o los tres números. En seis dimensiones, quizá es más conveniente ele¬ 
gir los seis números. 

Cuando los componentes se enumeran horizontalmente, suele utilizarse paréntesis y 
comas, y cuando el vector columna se indica verticalmente se usan llaves (sin comas). Lo 
que realmente importa es la suma de vectores y la multiplicación por un escalar (un nú¬ 
mero). En la figura 1,4a se muestra una suma vectorial, componente por componente: 


Suma vectorial 





a) Los vectores se suman a tí) Se suman las columnas 1 -)- 2 -f- ( 3 -)- 3) 

lo largo de los ejes 


Figura 1.4 La representación por columna: la combinación lineal de las columnas es 
igual a b. 
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En la figura de laitéfécláliáy una multiplicación por 2 (y si el vector hubiese sido multi¬ 
plicado por -2, entonces el vector hubiera invertido su dirección): 


Multiplicación por escalares 


También en la figura de la derecha se observa una de las ideas centrales del álgebra. 
Utiliza las dos operaciones básicas: los vectores se multiplican por números y luego se su¬ 
man. El resultado se denomina combinación lineal, y esta combinación resuelve nuestra 
ecuación: 

' 2 ] 1 
Combinación lineal 1 4+1—6 

—2J L 7 

La ecuación (2) requirió multiplicadores u, v, w, que producen el miembro derecho b. Estos 
números son u — 1, v — 1, w = 2.Y proporcionan la combinación correcta de las colum¬ 
nas. También proporcionaron el punto (1, 1, 2) en la representación por renglón (donde se 
cortan los tres planos). 

Nuestro verdadero objetivo es ir más allá de dos o tres dimensiones, hasta n dimensio¬ 
nes. Con n ecuaciones en n incógnitas, en la representación por renglón hay n planos. En 
la representación por columna hay n vectores, más un vector b en el miembro derecho. La 
ecuación pide una combinación lineal de las n columnas que sea igual a b. Para ciertas 
ecuaciones esto es imposible. Paradójicamente, la mejor manera de entender el caso bue¬ 
no es estudiando el caso malo. Por consiguiente, consideraremos la geometría, justo cuan¬ 
do falla, en el caso singular. 



Representación por renglón: intersección de planos 
Representación por columna : combinación de columnas 


El caso singular 

Suponga que nuevamente estamos en tres dimensiones, y que tres planos en la representa¬ 
ción por renglón no se cortan. ¿Qué puede estar mal? Una posibilidad es que dos planos 
pueden ser paralelos. Las ecuaciones 2u + v + u; = 5y4M + 2t> + 2w =11 son inconsis¬ 
tentes, y planos paralelos no dan solución (en la figura 1.5a se muestra una vísta del extre¬ 
mo). En dos dimensiones, la única posibilidad de falla la constituyen las rectas paralelas. Sin 
embargo, tres planos en tres dimensiones pueden estar en problemas sin ser paralelos. 

La dificultad más frecuente se muestra en la figura 1.5b. A partir de la vista del ex¬ 
tremo, los planos forman un triángulo. Cada par de planos se corta en una recta, y estas 

X 

dos planos 
paralelos 
a) 

Figura 1.5 Casos singulares: no hay solución para a), b), o d), una infinidad de solucio¬ 
nes para c). 
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rectas son paralelas. El tercer plano no es paralelo a los otros planos, pero es paralelo a su 
línea de intersección. Esto corresponde a un sistema singular con 6 = (2, 5, 6): 

u + v + w — 2 

No hay soluciones, como en la figura 1.5b 2 u + 3w = 5 (3) 

3 u + v + 4w = 6. 

Sumados, los dos primeros miembros izquierdos son iguales al tercero. En el miembro de¬ 
recho falla eso: 2 + 5 f 6. La ecuación 1 menos la ecuación 2 menos la ecuación 3 es la 
afirmación imposible 0=1. Así, las ecuaciones son inconsistentes, como la eliminación 
gaussiana descubre sistemáticamente. 

Otro sistema singular, próximo a éste, tiene una infinidad de soluciones. Una vez que 
el 6 en la última ecuación se vuelve 7, las tres ecuaciones se combinan para dar 0 = 0. Así, 
la tercera ecuación es la suma de las dos primeras. En ese caso, los tres planos tienen toda 
una recta en común (véase la figura 1.5c). Al cambiar los miembros derechos, los planos 
de la figura 1.56 se moverán en sentido paralelo a sí mismos, y para b = (2, 5, 7), repenti¬ 
namente la figura es diferente. El plano inferior se movió para encontrar a los otros, y hay 
una recta de soluciones. El problema 1.5c sigue siendo singular, pero ahora adolece de de¬ 
masiadas soluciones , en vez de tener unas cuantas. 

El caso extremo lo constituyen tres planos paralelos. Para la mayor parte de miembros 
derechos no hay solución (véase la figura 1.5 d). Para miembros derechos especiales (¡co¬ 
mo 6 = (0,0,0)!), hay todo un plano de soluciones, ya que los tres planos paralelos se mue¬ 
ven para convertirse en el mismo. 

¿Qué ocurre con la representación por columna cuando el sistema es singular? Debe 
estar mal, aunque la pregunta es como. En el miembro izquierdo de las ecuaciones sigue ha¬ 
biendo tres columnas, y se intenta combinarlas para obtener b. Se queda con la ecuación (3): 


Caso singular: representación por columna 

Tres columnas en el mismo piano 

Fácil de resolver sólo para b en ese plano 



I" 1 ! 

T 


Y 

u 

[2 + V 

0 

+ w 

3 


- J 

1 


4 


Para b = (2, 5, 7) era posible esto; para b = (2, 5, 6) no lo era. La razón de esto es que es¬ 
tas tres columnas están en un plano. Entonces cualquier combinación también está en el 
plano (que pasa por el origen). Si el vector b no está en ese plano, ninguna solución es po¬ 
sible (véase la figura 1.6). Éste es por mucho el evento más probable; un sistema singular 



en general no tiene solución. Sin embargo, hay una posibilidad de que b esté en el plano 
de las columnas. En ese caso hay demasiadas soluciones; las tres columnas pueden com¬ 
binarse en una infinidad de formas para producir b. Esa representación por columna de 
la figura 1.66 corresponde a la representación por renglón de la figura 1.5c. 

¿Cómo se puede saber que las tres columnas están en el mismo plano? Una respuesta 
consiste en encontrar una combinación de las columnas cuya suma sea cero. Después de al¬ 
gunos cálculos, esta combinación es « = 3, v = —l,w— —2. Tres veces la columna 1 es 
igual a dos veces la columna 2 más dos veces la columna 3. La columna 1 está en el plano 
de las columnas 2 y 3. Sólo dos columnas son independientes. 

El vector 6 = (2, 5, 7) está en ese plano de las columnas: es la columna 1 más la co¬ 
lumna 3, de modo que (1,0, 1) es una solución. Es posible sumar cualquier múltiplo de la 
combinación (3, — 1, —2) que produzca 6 = 0. Así, hay toda una recta de soluciones, co¬ 
mo se sabe a partir de la representación por renglón. 

La verdad es que se sabía que las columnas deben combinarse para obtener cero, ya 
que eso ocurría con los renglones. Este hecho pertenece a las matemáticas, no a los cálcu¬ 
los, y sigue siendo verdadero en la dimensión n. Si los n planos no tienen ningún punto 
en común, o comparten una infinidad de puntos, entonces las n columnas están en el 
mismo plano. 

Si la representación por renglón falla, entonces también falla la representación por co¬ 
lumna. Esto hace la diferencia entre el capítulo 1 y el capítulo 2. En el capítulo 1 se estudia 
el problema más importante: el caso no singular, donde hay una solución que es necesario 
encontrar. En el capítulo 2 se estudia el caso general, donde puede haber muchas soluciones 
o ninguna. En ninguno de estos dos casos es posible continuar sin tener una notación {nota¬ 
ción matricial), y un algoritmo ( eliminación ) idóneos. Después de los siguientes ejercicios 
se abordará la eliminación. 


|E Conjunto de problemas 1.2 

1. Para las ecuaciones x + y = 4, 2x — 2y = 4, trace la representación por renglón (dos 
rectas que se cortan), y la representación por columna (combinación de dos columnas 
igual al vector columna (4, 4) en el miembro derecho). 

2. Resuelva lo siguiente para encontrar una combinación de las columnas que sea igual a 6: 

u — v — w = 6i 
Sistema triangular v + w = b 2 

w — 63. 

3. (Recomendado) Describa la intersección de los tres planos u+v+w+z=6yu+ 
w + z = 4yu + w = 2 (todos en el espacio tetradimensional). ¿Es una recta, un pun¬ 
to o un conjunto vacío? ¿Cuál es la intersección si se incluye el cuarto plano u = -1? 
Encuentre una cuarta ecuación que deje la situación sin solución. 

4. Trace las tres rectas siguientes, y decida si las ecuaciones son de fácil solución: 

x + 2y = 2 
Sistema de 3 por 2 x — y = 2 

y = l 

¿Qué ocurre si todos los miembros izquierdos son cero? ¿Hay alguna opción diferen¬ 
te de cero de miembros derechos que permita que las tres rectas se cortan en el mismo 
punto? 

5. Encuentre dos puntos en la recta de intersección de los tres planos í= Oyz = Oy 
x + y + z + t = lenel espacio de 4 dimensiones. 


Figura 1.S Casos singulares: 6 fuera o dentro del plano con todas las tres columnas. 
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6. Cuando b = (2, 5, 7), encuentre una solución (m, n, iu) de la ecuación (4) distinta de 
la solución (1,0, 1), mencionada en el texto. 

7. Proporcione dos miembros derechos más, aparte de b = (2, 5, 7) para los cuales la 
ecuación (4) pueda resolverse. Proporcione dos miembros derechos más, aparte de 
b = (2, 5, 6) para los cuales la ecuación (4) no pueda resolverse. 

8. Explique por qué el sistema 

u 4- v + ui — 2 
u + 2v + 3w — 1 
v + 2w = 0 

es singular, encontrando una combinación de las tres ecuaciones que produzca 0=1. 
¿Qué valor debe sustituirse en el último cero del miembro derecho para que las ecua¬ 
ciones tengan soluciones, y cuál es una de las soluciones? 

9. La representación por columna del ejercicio anterior (sistema singular) es 


u 1 + v 

0 


+ w 3 = b. 
2 


Demuestre que las tres columnas de la izquierda están en el mismo plano, expresando 
la tercera columna como una combinación de las dos primeras. ¿Cuáles son las solu¬ 
ciones ( u , v, w) si b es el vector cero (0, Q, 0)? 

10. (Recomendado) ¿Bajo qué condición sobre y u y 2 , y 3 los puntos (0, y t ), (1, y 2 ), (2, y 3 ) 
están en una línea recta? 

11. Es cierto que la solución de las siguientes ecuaciones es x — y = 0. ¿Para qué valores 
de a hay toda una recta de soluciones? 

ax + 2y = 0 
2x + ay = 0 

12. Empezando con x + 4y = 7, encuentre la ecuación de la recta paralela que pasa por 
x = 0, y - 0. Encuentre la ecuación de otra recta que corta a la primera en x = 3, y = 1. 


Los problemas 13 a 15 son un repaso de las representaciones por renglón y por 

columna. 

13. Trace las dos representaciones en dos planos para las ecuaciones x - 2y = 0, x 4 - y — 6. 

14. Para dos ecuaciones lineales en tres incógnitas x, y, z, la representación por renglón 

muestra (2 o 3) (rectas o planos) en un espacio (bi o tri) dimensional. La representa¬ 
ción por columna es en un espacio (bi o tri) dimensional. Las soluciones normalmen¬ 
te están en un_. 

15. Para cuatro ecuaciones lineales en dos incógnitas x y y, la representación por renglón 

muestra cuatro __. La representación por columna está en un espacio_di¬ 

mensional. Las ecuaciones no tienen solución, a menos que el vector del miembro de¬ 
recho sea una combinación de__. 

16. Encuentre un punto con z = 2 en la recta de intersección de los planos x + y + 3z - 
6yx-y + z = 4. Encuentre el punto con z = 0 y un tercer punto a la mitad entre los 
dos puntos anteriores. 


1.3 Un ejemplo de eliminación gaussiana 


11 


17. La primera de las siguientes ecuaciones más la segunda es igual a la tercera: 

x + y + z = 2 
x + 2y + z = 3 
2x + 3y + 2z =5. 

Los dos primeros planos se encuentran a lo largo de una recta. El tercer plano contie¬ 
ne a esta recta, ya que si x, y, z satisfacen las dos primeras ecuaciones, entonces tam¬ 
bién _. Las ecuaciones tienen una infinidad de soluciones (toda la recta L). En¬ 

cuentre las tres soluciones. 

18. Mueva el tercer plano en el problema 17 hasta un plano paralelo 2x + 3y + 2z = 9. 

Ahora, las tres ecuaciones no tienen solución; ¿por qué ? Los dos primeros planos se 
encuentran a lo largo de la recta L, pero el tercero no_esa recta. 

19. En el problema 17, las columnas son (1,1,2) y (1,2, 3) y (1,1,2). Este es un “caso sin¬ 
gular” porque la tercera columna es_. Encuentre dos combinaciones de las colum¬ 
nas que proporcionen b = (2, 3, 5). Esto sólo es posible para b — (4, 6, c) si c = . 

20. Normalmente, 4 “planos” en el espacio tetradimensional se cortan en un_. Nor¬ 

malmente, 4 vectores columna en el espacio de 4 dimensiones pueden combinarse pa¬ 
ra producir b. ¿Qué combinación de (1, 0, 0,0), (1, 1,0, 0), (1,1, L 0), (1, 1, 1, 1) pro¬ 
duce b — (3, 3, 3, 2)? ¿Cuáles son las 4 ecuaciones que está resolviendo para x, y, z, í? 

21. Cuando la ecuación 1 se suma a la ecuación 2, ¿cuál de las siguientes opciones cam¬ 
bia: los planos en la representación por renglón, la representación por columna, la ma¬ 
triz de coeficientes, la solución? 

22. Si ( a , b) es un múltiplo de (c, d) con abcd t 6 0, demuestre que (a, c ) es un múltiplo de 
{b , d). Esto es sorprendentemente importante: denomínela pregunta de desafío. Primero 
puede usar números para ver cómo están relacionados a, b, c y d. La pregunta lleva a: 

Si A = a j tiene renglones dependientes, entonces tiene columnas dependientes. 

23. En estas ecuaciones, la tercera columna (que multiplica a w ) es la misma que el miem¬ 
bro derecho b. La forma en columna de las ecuaciones, ¿qué solución para (u, v, w) 
proporciona de inmediato ? 

6u + 7v + Sw = 8 
4u + 5v + 9w = 9 
2u — 2v + 7w = 7. 


1.3 UN EJEMPLO DE ELIMINACIÓN GAUSSIANA 

La forma de entender la eliminación es por medio de un ejemplo. Se empieza en tres di¬ 
mensiones: 

2u + v + w = 5 

Sistema original 4u — 6v = — 2 (1) 

—2 u + 7v + 2w = 9. 

El problema consiste en encontrar los valores incógnitos de u, v, y w, de modo que se 
aplicará eliminación gaussiana. (Gauss es reconocido como el más grande de los matemá¬ 
ticos, aunque no ciertamente debido a este invento, que quizá le llevó 10 minutos. Irónica¬ 
mente, es el concepto más frecuentemente utilizado que lleva su nombre.) El método em- 
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pieza por restar múltiplos de la primera ecuación a las otras ecuaciones. El objetivo es 
eliminar u de las dos últimas ecuaciones. Para lograr este objetivo se requiere lo siguien¬ 
te: 

a) restar 2 veces la primera ecuación de la segunda 

b ) restar -1 vez la primera ecuación de la tercera. 

2u + v + w — 5 

Sistema equivalente — 8u — 2u> = —12 (2) 

8u + 3w = 14. 

El coeficiente 2 es el primer pivote. La eliminación consiste en dividir constantemente el 
primer pivote entre los números que están abajo de él, con la finalidad de encontrar los mul¬ 
tiplicadores idóneos. 

El pivote de la segunda etapa de la eliminación es -8. Ahora se ignora la primera 
ecuación. Un múltiplo de la segunda ecuación se restará de las ecuaciones que quedan (en 
este caso sólo queda la tercera) con la finalidad de eliminar v. La segunda ecuación se su¬ 
ma a la tercera o, en otras palabras, 

c) se resta -1 vez la segunda ecuación de la tercera. 

Ahora el proceso de eliminación está completo, por lo menos en la dirección “hacia ade¬ 
lante”: 

2 u + v + w = 5 

Sistema triangular -8v - 2w = -12 (3) 

1 w = 2. 

Este sistema se resuelve hacia atrás, de abajo arriba. La última ecuación da w = 2. Al 
sustituir en la segunda ecuación, se encuentra v = 1. Luego, la primera ecuación da u = 1. 
Este proceso se denomina sustitución hacia atrás. 

Para repetir: con la eliminación hacia adelante se obtuvieron los pivotes 2, -8, 1. En 
este método se restan múltiplos de cada renglón de los renglones de abajo para llegar al sis¬ 
tema ‘ triangular” (3), que se resuelve en orden inverso. Luego, cada nuevo valor calcula¬ 
do se sustituye en las ecuaciones restantes. 

Observación Una forma aceptable de escribir los pasos de la eliminación hacia adelante 
es incluir el miembro derecho como una columna adicional. No es necesario copiar uy v 
y w y = en cada paso, por lo que se trabaja con lo mínimo indispensable: 

2 1 1 5] [211 5] [211 5" 

4-6 0 —2 —> 0 —8 —2 -12 -> 0 -8 -2 -12 

.-2 7 2 9J L° 8 3 14 J L° 0 1 2 

Al final se llega al sistema triangular, que ya está listo para la sustitución hacia atrás. Qui¬ 
zá el lector prefiera esta disposición, que garantiza que las operaciones en el miembro iz¬ 
quierdo de la ecuación también se realizan en el miembro derecho, ya que ambos miem¬ 
bros están juntos ahí. 

En un problema más grande, la eliminación hacia adelante requiere más esfuerzo. Se 
usan múltiplos de la primera ecuación para producir ceros abajo del primer pivote. Luego, 
la segunda columna se limpia abajo del segundo pivote. El paso hacia adelante se finaliza 
cuando el sistema es triangular; la ecuación n sólo contiene a la última incógnita multipli¬ 
cada por el último pivote. 
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La sustitución haciá r átráS-pT:oduce lá^bl'uéiSi^Óñiji&ta en orden opuesto: se empieza con 
la última incógnita, luego se resuelve de la siguiente hasta la última, terminando con la 
primera. 

Por definición, los pivotes no pueden ser cero. Es necesario dividir entre ellos. 


La falla de la eliminación 


¿En qué circunstancias es posible que falle el proceso? Algo debe estar mal en el caso 
singular, y algo puede estar mal en el caso no singular. Esto podría parecer algo prematu¬ 
ro; después de todo, apenas se ha logrado tener funcionando al algoritmo. Sin embargo, la 
posibilidad de falla ilumina al método en sí. 

La respuesta es: con un conjunto completo de n pivotes, sólo hay una solución. El sis¬ 
tema es no singular, y se resuelve por eliminación hacia adelante y sustitución hacia atrás. 
Pero si en una posición pivote aparece un cero, es necesario detener la eliminación, ya sea 
temporal o permanentemente. El sistema puede o no ser singular. 

Si el primer coeficiente es cero, en la esquina superior izquierda, la eliminación de u 
de las otras ecuaciones es imposible. Lo mismo es cierto en toda etapa intermedia. Obser¬ 
ve que en una posición pivote puede aparecer un cero, aun si el coeficiente original en ese 
sitio no era cero. En términos generales, no se sabe si aparecerá un cero sino hasta que 
se intenta, al realizar en verdad el proceso de eliminación. 

En muchos casos este problema puede restablecerse, por lo que la eliminación puedé 
continuar. Un sistema así sigue siendo no singular; es sólo el algoritmo lo que requiere re¬ 
paración. En otros casos es inevitable la falla. Estos sistemas incurables son singulares; no 
tienen solución o tienen una infinidad de éstas, por lo que no es posible encontrar un con¬ 
junto completo de pivotes. 


Ejemplo 1 No singular (restablecido al intercambiar las ecuaciones 2 y 3) 

u + v + w = _ u + v + vü =_ u + v + w = _ 

2u + 2v + 5w = _♦ 3 w = _* 2v + 4 w = — 

4 u + 6v + 8w = _ 2v + 4u> =_ 3w = _ 


El sistema es triangular, y puede resolverse con sustitución hacia atrás. 


Ejemplo 2 Singular (caso incurable) 

u + V + W — _ U + V + w = _ 

2m + 2u + 5w =_ _♦ 3w = _ 

4n + 4v + 8w = _ 4w =_ 

No existe ningún intercambio de ecuaciones que pueda evitar el cero en la segunda posi¬ 
ción pivote. Las ecuaciones mismas pueden ser o no fáciles de resolver. Si las dos últimas 
ecuaciones son 3w = 6 y 4w = 7, no hay solución. Si ocurre que estas dos ecuaciones son 
consistentes, como con 3in = 6 y 4w = 8, entonces este caso singular tiene una infinidad 
de soluciones. Se sabe que w = 2, pero la primera ecuación no puede decidir ambas uy v. 

En la sección 1.5 se abordarán los intercambios de renglón cuando el sistema es no 
singular. Así, los intercambios producen un conjunto completo de pivotes. En el capítulo 2 
se estudia el caso singular. El 3w aún puede eliminar a 4w, por lo que el segundo pivote es 
3. (No habrá un tercer pivote). Por ahora se confía en que todos los n elementos pivote son 
diferentes de cero, sin cambiar el orden de las ecuaciones. Éste es el mejor caso, que será 
continuado. 
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El costo de la eliminación 

La otra pregunta es muy práctica. ¿ Cuántas operaciones aritméticas requiere la elimina¬ 
ción para n ecuaciones en n incógnitas ? Si n es grande, una computadora puede realizar 
el proceso de eliminación. Debido a que se conocen todos los pasos, debe ser posible po¬ 
der pronosticar el número de operaciones. 

Por el momento se ignorarán los miembros derechos de las ecuaciones, y sólo se con¬ 
tarán las operaciones a la izquierda. Estas operaciones son de dos clases. Se divide entre el 
pivote para encontrar qué múltiplo (por ejemplo l) de la ecuación pivote debe restarse. Una 
vez que se realiza esta sustracción, continuamente se encuentra una combinación “multipli- 
car-restar”; los términos de la ecuación pivote se multiplican por l, y luego se restan de otra 
ecuación. 

Suponga que cada división, y cada multiplicación-sustracción se denomina una ope¬ 
ración. En la columna 1, se requieren n operaciones por cada cero que se obtiene : una pa¬ 
ra encontrar el múltiplo í, y la otra para encontrar los nuevos elementos a lo largo del 
renglón. Abajo del primer renglón hay n - 1 renglones, de modo que la primera etapa de la 
eliminación requiere n(n - 1) = n 2 - n operaciones. (Otra forma de llegar a n 2 — n es ésta: 
es necesario cambiar todos los n 2 elementos, excepto los n en el primer renglón). Las eta¬ 
pas posteriores son más rápidas porque las ecuaciones son más cortas. 

Cuando la eliminación se realiza con k ecuaciones, para limpiar la columna que está aba¬ 
jo del pivote se requieren sólo k 2 - k operaciones, por el mismo razonamiento que se aplicó 
en la primera etapa, cuando k era igual a n. Al reunir todo lo anterior, se encuentra que el nú¬ 
mero total de operaciones es la sumatoria de ¡c - k sobre todos los valores k desde 1 hasta n: 

... , . , ,2 . , 2 \ /, , . n{n + l)(2n + 1) n(n + 1) 

Miembro izquierdo V + • • • + n 2 ) - (1 + • • • +n) = —-—- - -1-i 

6 2 

_ n 3 — n 
3 ' 

Estas fórmulas son normales para encontrar las sumatorias de los n primeros números y los 
n primeros cuadrados. Al sustituir n— 1 y n = 2 y n = 100 en la fórmula | (n 3 - n), la eli¬ 
minación hacia adelante puede no requerir ningún paso, requerir dos pasos o requerir alre¬ 
dedor de un millón de pasos: 

Si n no es grande en absoluto, una buena estimación para 
el número de operaciones es | n 3 . 

Si el tamaño se duplica, y pocos de los coeficientes son cero, entonces el costo se multipli¬ 
ca por 8. 

La sustitución hacia atrás es considerablemente más rápida. La última incógnita se en¬ 
cuentra en sólo una operación (una división entre el último pivote). Para encontrar la ante¬ 
penúltima incógnita se requieren dos operaciones, y así sucesivamente. Entonces, el total 
para la sustitución hacia atrás es 1 + 2 + •••+«. 

La eliminación hacia adelante también actúa sobre el miembro derecho (restando los 
mismos múltiplos que en la izquierda con la finalidad de preservar las ecuaciones correc¬ 
tas). Empieza con n - 1 sustracciones de la primera ecuación. Junto con el miembro dere¬ 
cho es responsable de n 2 operaciones: mucho menos que las n 3 l 3 a la izquierda. El total 
para la eliminación hacia adelante y la sustitución hacia atrás es 

Miembro derecho [(« — 1) + (n — 2) + • • • +1] + [1 + 2 + • • • + n] = n 2 . 

Hace 30 años, casi cualquier matemático hubiera conjeturado que un sistema general 
de orden n no podía resolverse con mucho menos que n 3 / 3 multiplicaciones. (Incluso ha- 
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bía teoremas para demostrarlo, aunque no tomaban en cuenta a todos los métodos posibles). 
Sorprendentemente, se ha demostrado que esa conjetura es errónea. \En la actualidad exis¬ 
te un método que requiere sólo Cn Iog 2 7 multiplicaciones ! Depende de un simple hecho: pa¬ 
rece que dos combinaciones de dos vectores en el espacio bidimensionai requieren 8 multi¬ 
plicaciones, aunque es posible hacerlas en 7. Lo anterior redujo el exponente de log 2 8, que 
es 3, a log 2 7 = 2.8. Este descubrimiento provocó bastante actividad para encontrar la po¬ 
tencia mínima posible de n. El exponente finalmente cayó (en EBM) debajo de 2.376. Afor¬ 
tunadamente para la eliminación, la constante C es tan grande y el código es tan difícil que 
el nuevo método es bastante (o completamente) interesante desde el punto de vista teórico. 
El problema más reciente es el costo con muchos procesadores en paralelo. 

Conjunto de problemas 1.3 

Los problemas 1 a 9 son sobre eliminación en sistemas de 2 por 2. 

1. ¿Qué múltiplo de l de la ecuación 1 debe restarse de la ecuación 2? 

2x + 3y = 1 
10 x +9y = 11. 

Después de este paso de eliminación, escriba el sistema triangular superior e identifi¬ 
que los dos pivotes. Los números 1 y 11 no afectan tales pivotes. 

2. Resuelva por sustitución hacia atrás el sistema triangular del problema 1, y antes que x. 
Compruebe que x multiplicado por (2, 10) más y por (3, 9) es igual a (1, 11). Si el 
miembro derecho cambia a (4, 44), ¿cuál es la nueva solución? 

3. ¿Qué múltiplo de la ecuación 2 debe restarse de la ecuación 3? 

2x — 4y = 6 
—x + 5y = 0. 

Después de este paso de eliminación, resuelva el sistema triangular. Si el miembro de¬ 
recho cambia a (-6, 0), ¿cuál es la nueva solución? 

4. ¿Qué múltiplo de í de la ecuación 1 debe restarse de la ecuación 2? 

ax + by = f 
ex + dy = g. 

El primer pivote es a (se supone que es cero). ¿Qué fórmula para el segundo pivote pro¬ 
duce la eliminación? ¿Qué es y? El segundo pivote falta cuando ad — be. 

5. Escoja un miembro derecho que no proporcione ninguna solución, y un miembro de¬ 
recho que no proporcione una infinidad de soluciones. ¿Cuáles son dos de estas solu¬ 
ciones? 

3x + 2y = 10 
6x + 4y = _. 

6. Escoja un coeficiente b que haga singular este sistema. Luego, escoja un miembro de¬ 
recho g que lo haga fácil de resolver. Encuentre dos soluciones en ese caso singular. 

2 x +by = 16 
4x + 8y = g. 
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7. ¿Para qué números a la eliminación falla a) permanentemente, y b) temporalmente? 

ax + 3y — —3 
4x + 6 y = 6. 

Resuelva para xyy después de fijar la segunda falla por un intercambio de renglón. 

8. ¿Para cuáles tres números k falla la eliminación? ¿Cuál es fijada por un intercambio 
de renglón? En cada caso, el número de soluciones, ¿es 0 o 1 o oo? 

kx + 3y = 6 

3 x + ky = — 6. 

9. ¿Qué prueba sobre b l y b 2 decide si estas dos ecuaciones permiten una solución? 
¿Cuántas soluciones tienen? Trace la representación por columna. 

3x —2 y = bi 
6x — 4 y — ¿> 2 . 

Los problemas 10 a 19 estudian la eliminación en sistemas de 3 por 3 (y la falla 
posible). 

10. Reduzca el siguiente sistema a forma triangular superior, mediante dos operaciones en 
renglones: 

2x + 3y + z = 8 
4x + 7y + 5z = 20 
-2y + 2z = 0. 

Identifique los pivotes. Resuelva por sustitución hacia atrás para z, y, x. 

11. Aplique eliminación (identifique los pivotes) y sustitución hacia atrás para resolver 

2x — 3 y =3 
4x — 5y + z = 7 
2.x — y - 3z = 5. 

Enumere las tres operaciones en renglones: Restar_veces el renglón_del 

renglón_. 

12. ¿Cuál número d obliga a un intercambio de renglón, y cuál es el sistema triangular (no 
singular) para ese di ¿Cuál d hace singular a este sistema (no el tercer pivote)? 

2x + 5y + z ~ 0 
4x + dy + z —2 
y ~ z = 3. 

13. ¿Cuál número d lleva posteriormente a un intercambio de renglón? ¿Cuál número b 
lleva posteriormente a un pivote fallante? En ese caso singular, encuentre una solu¬ 
ción x, y, z diferente de cero. 

x + by =0 
x — 2 y — z = 0 
y + z = 0. 


1.3 Un ejemplo de eliminación gaussiana 


17 


14. a) Escriba un sistema de 3 por 3 que requiera dos intercambios de renglones para al¬ 

canzar una forma triangular, y una solución. 
b ) Escriba un sistema de 3 por 3 que requiera un intercambio de renglones para fun¬ 
cionar, y que falle después. 

15. Si los renglones 1 y 2 son los mismos, ¿hasta dónde es posible llegar con la elimina¬ 
ción (permitiendo intercambio de renglones)? Si las columnas 1 y 2 son las mismas, 
¿cuál pivote falta? 

2x — y + z = 0 2x + 2y + z = 0 

2x — y + z = 0 4x + 4y + z = 0 

4x + y + z = 2 6x + 6y + z = 2. 

16. Escriba un ejemplo de 3 por 3 que tenga 9 coeficientes distintos en el miembro izquier¬ 

do, pero que los renglones 2 y 3 se vuelvan cero en la eliminación. ¿Cuántas solucio¬ 
nes tiene este sistema con b = (1, 10, 100), y cuántas tiene con b = (0, 0, 0)? 

17. ¿Cuál número q hace singular al siguiente sistema, y con qué miembro derecho t el sis¬ 
tema tiene una infinidad de soluciones? Encuentre la solución que tiene z = 1. 

x + 4y - 2z =1 
x + 7y - 6z =6 
3 y + qz = t. 

18. (Recomendado) Es imposible que un sistema de ecuaciones lineales tenga exactamen¬ 
te dos soluciones. Explique por qué. 

á) Si (x, y, z ) y (X, Y, Z) son dos soluciones, ¿cuál es otra? 
b ) Si 25 planos se encuentran en dos puntos, ¿dónde más se encuentran? 

19. Puede ocurrir que tres planos fallen en tener un punto de intersección, cuando ningún 

par de ellos es paralelo. El sistema es singular si el renglón 3 de A es una_de los 

primeros dos renglones. Encuentre una tercera ecuación que no sea posible resolver si 
x + y + z = 0yx-2y-z = 1. 

En los problemas 20 a 22 se abordan sistemas de 4 por 4, y de n por n. 

20. Encuentre los pivotes, y las soluciones de las cuatro siguientes ecuaciones: 

2 x + y =0 

x + 2y + z =0 
y + 2z + t = 0 

z + 2r = 5. 

21. Si el problema 20 se extiende siguiendo el patrón 1, 2, 1 o el patrón -1,2, —1, ¿cuál 
es el quinto pivote? ¿Cuál es el n-ésimo pivote? 

22. Aplique eliminación y sustitución hacia atrás para resolver 

2u + 3v =0 

4u + 5v + w = 3 
2 u — v — 3w = 5. 

¿Cuáles son los pivotes? Enumere las tres operaciones en las que el múltiplo de un 
renglón se resta de otro renglón. 
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23. Para el sistema 

u + v 4- w = 2 
u + 3v + 3w = 0 
u + 3v + 5w = 2, 

¿Cuál es el sistema triangular después de la eliminación hacia adelante, y cuál es la so¬ 
lución? 

24. Resuelva el siguiente sistema, y encuentre los pivotes cuando 

2 u — v =0 

—w +2 v — w =0 
—v + 2tt¡ — z = 0 
—m + 2z = 5. 

Es posible llevar el miembro derecho como una quinta columna (y así omitir escribir 
tí, v, w, z hasta la solución al final). 

25. Aplique eliminación al sistema 

ií + v + w =—2 
3« + 3v — w = 6 
u — v + w — — 1. 

Cuando en la posición pivote aparezca un cero, intercambie esa ecuación por la que 
está abajo, y continúe. ¿Qué coeficiente de v en la tercera ecuación, en lugar del — 1 
actual, haría imposible continuar, y forzar a una falla en la eliminación? 

26. Resuelva por eliminación el siguiente sistema de ecuaciones 

x — y = 0 
3x + 6y — 18. 

Trace una gráfica que representa cada ecuación como una línea recta en el plano x — y, 
las rectas se cortan en la solución. También, agregue una recta más: la gráfica de una 
nueva segunda ecuación que aparece después de la eliminación. 

27. Encuentre tres valores de a para los cuales falle la eliminación, temporal o permanen¬ 
temente, en 

au + v = 1 
4íí + av = 2. 

La falla en el primer paso puede establecerse intercambiando renglones, pero en el úl¬ 
timo paso no hay falla. 

28. Falso o verdadero: 

a) Si la tercera ecuación inicia con un coeficiente cero (empieza con 0n), entonces 
ningún múltiplo de la ecuación 1 se resta de la ecuación 3. 

b) Si el segundo coeficiente de la tercera ecuación es cero (contiene a Ou), entonces 
ningún múltiplo de la ecuación 2 se resta de la ecuación 3. 

c) Si la tercera ecuación contiene a Ou y a Ov, entonces ningún múltiplo de la ecuación 
1 o de la ecuación 2 se resta de la ecuación 3. 
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29. (Bastante opcional). Normalmente la multiplicación de dos números complejos 

(a + ib)(c + id) — (ac — bd) + i(bc + ad) 

implica las cuatro multiplicaciones por separado ac, bd, be, ad. Ignorando a i, ¿puede 
calcular ac-bdy be + ad con sólo tres multiplicaciones? (Puede realizar sumas, co¬ 
mo formar a + b antes de multiplicar, sin ninguna penalización.) 

30. Aplique eliminación para resolver 

u + v + w = 6 u + v + w = 1 

u + 2v + 2w = 11 y u + 2v + 2w = 10 
2u + 3v — 4 w =3 2u + 3v — 4 w = 3. 


31. ¿Para cuáles tres números a la eliminación fracasa en proporcionar tres pivotes? 

ax + 2y + 3z = b\ 
ax + ay + 4z = h 2 
ax + ay + az = ¿> 3 . 

32. Encuentre experimentalmente el tamaño medio (valor absoluto) de los pivotes prime¬ 
ro, segundo y tercero para MATLAB con lu(rand(3, 3)). El promedio del primer pi¬ 
vote a partir de abs(A(l, 1)) debe ser 0.5. 


1.4 NOTACION MATRICIAL Y MULTIPLICACION DE MATRICES 

Con el ejemplo de 3 por 3 es posible escribir por completo todas las ecuaciones. Es posible 
enumerar los pasos de la eliminación, los cuales restan un múltiplo de una ecuación a otra 
para llegar a una matriz triangular. Para un sistema grande, esta forma de mantener el rastro 
de la eliminación sería inútil; se requiere un registro mucho más conciso. 

A continuación se presenta la notación matricial para describir el sistema original, y 
la multiplicación de matrices para describir las operaciones que lo hacen más sencillo. 
Observe que en el ejemplo aparecen tres tipos distintos de cantidades: 

_„ . . 2u + v + w = 5 


Nueve coeficientes 

Tres incógnitas 

Tres miembros derechos 


4« — 6v 
—2 u + 7u + 2w 


En el miembro derecho está el vector columna b. En el miembro izquierdo están las incóg¬ 
nitas tí, v, w. En el miembro izquierdo también están nueve coeficientes (de los cuales uno 
es cero). Resulta natural representar las tres incógnitas por medio de un vector: 


La incógnita es x 


La solución es x = 1 

2 


Los nueve coeficientes están en tres renglones y tres columnas, con lo que se obtiene una 
matriz de 3 por 3: 


Matriz de coeficientes A 


1 1 

-6 0 

7 2 
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A es una matriz cuadrada, porque el número de ecuaciones es igual al número de incógni¬ 
tas, Si hay n ecuaciones en n incógnitas, se tiene una matriz cuadrada de n por n. De ma¬ 
nera más general, podría haber m ecuaciones y n incógnitas. En este caso, A es rectangu¬ 
lar, con m renglones y n columnas. Se dice que es una “matriz de m por n”. 

Las matrices se suman entre sí, o multiplican por constantes numéricas, exactamente 
como ocurre con los vectores: elemento por elemento. De hecho, los vectores pueden con¬ 
siderarse como casos especiales de las matrices; son matrices con una sola columna. Así 
como con los vectores, la suma de dos matrices sólo es posible si tienen la misma forma: 


Adición A + B 21 1 z 

3 q + 3 2 

Multiplicación 2A q ^ \ 2 


2 1 
2 3 0 
0 4 


4 2 

6 0 . 
0 8 


Multiplicación de una matriz por un vector 


Es necesario volver a escribir las tres ecuaciones con las tres incógnitas u, v, w en la for¬ 
ma matricial simplificada Ax = b. Escrita completamente, la multiplicación de una matriz 
por un vector es igual al vector: 


Forma matricial Ax = b 


El miembro derecho b es el vector columna de los “términos no homogéneos”. El miem¬ 
bro izquierdo es A por x. Esta multiplicación se define exactamente de modo que repro¬ 
duzca el sistema original La primera componente de Ax se obtiene al “multiplicar” el pri¬ 
mer renglón de A en el vector columna x: 


Renglón multiplicado por columna [2 1 1 ] 


[ 2w + u + w ] = [5] 


La segunda componente del producto Ax es 4u - 6v + Ow, del segundo renglón de A. La 
ecuación matricial Ax = b es equivalente a las tres ecuaciones simultáneas en la ecuación (1). 

El renglón por columna es fundamental para todas las multiplicaciones de matrices. 
A partir de dos vectores produce un solo número. Este número se denomina producto in¬ 
terno de los dos vectores. En otras palabras, el producto de una matriz de 1 por n (un vec¬ 
tor renglón) y una matriz de n por 1 (un vector columna) es una matriz de 1 por 1: 


Producto interno 


1 1 ] 1 = [ 2 - 1 + 1•1 + 1 - 2 ] 
2 


Esto confirma que la solución propuesta* = (1, 1,2) satisface la primera ecuación. 

Hay dos formas de multiplicar una matriz Ay un vector x. Una forma es multiplicar 
renglón por renglón. Cada renglón de A se combina con * para obtener una componente de 
Ax. Cuando A tiene tres renglones, se tienen tres productos. 


1 1 6l [2 

Ax multiplicado por renglones 3 0 1 5 

114 0 


1 -2 + 1 -5 -f-6-0 
3-2+0-54-3-0 
1-2 + 1 -5+4-0 


7 

6 . (4) 

7 
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Así es como suele explicarse Ax, aunque la segunda forma es igualmente importante. De 
hecho, ¡es más importante! Realiza la multiplicación de una columna a la vez. El produc¬ 
to Ax se encuentra de una vez, como una combinación de las tres columnas de A; 



La respuesta es dos veces la columna 1 más 5 veces la columna 2. Esto corresponde a la 
“representación por columna” de las ecuaciones lineales. Si el miembro derecho b tiene las 
componentes 7, 6, 7, entonces la solución tiene componentes 2, 5, 0. Por supuesto, la re¬ 
presentación por renglón coincide con aquélla (y finalmente se tienen las mismas multipli¬ 
caciones). 

La regla de las columnas se utilizará una y otra vez, de modo que para recalcarla se 
repite a continuación: 


1A Todo produi 
ecuación (5). Por 
coeficientes son 1 


> Ax puede encontrarse usando todas las columnas como en la 
insiguiente, Ax es una combinación de las columnas de A. Los 
componentes de x. . , 


; columnas como en la 


Para multiplicar A por x en n dimensiones, se requiere una notación para los elemen¬ 
tos individuales en A. El elemento en el renglón i y en la columna j siempre se denota por 
a¡j. El primer subíndice proporciona el número de renglón, y el segundo subíndice indica 
la columna. (En la ecuación (4), a 2i es 3 y a 13 es 6.) Si A es una matriz de m por n, enton¬ 
ces el índice i va desde 1 hasta m, ya que hay m renglones, y el índice j va desde 1 hasta n. 
En total, la matriz tiene mn elementos, y a mn está en la esquina inferior derecha. 

Para denotar un vector basta un índice. La y'-ésima componente de x se denota x r (La 
multiplicación anterior tenía x, = 2, x 2 = 5, x 3 = 0.) Normalmente, x se escribe como un 
vector columna; es decir, como una matriz de n por 1. Pero algunas veces se escribe en 
una línea, como en x = (2, 5, 0). Los paréntesis y las comas recalcan que no es una ma¬ 
triz de 1 por 3. Se trata de un vector columna, que sólo se ha escrito temporalmente en 
forma horizontal. 

Para describir el producto Ax se utiliza el símbolo “ sigma ” X para sumatorias: 


Notación sigma 



Esta suma se lleva el í-ésimo renglón de A. El índice de la columna,/ toma cada valor des¬ 
de 1 hasta n y los resultados se suman: la suma es a a x x + a¡ 2 x 2 + ■ • • + a ir ¿c n . 

De nuevo se observa que la longitud de los renglones (el número de columnas en A) 
debe corresponder a la longitud de x. Una matriz de m por n multiplica un vector «-di¬ 
mensional (y produce un vector m-dimensional). Las sumatorias son más sencillas que es¬ 
cribir todo completamente, pero la notación matricial es mejor. (Einstein utilizó “notación 
tensorial”, en la que un índice repetido significa automáticamente una sumatoria. Escribió 
üijXj, e incluso a{x¡, sin el signo X. Como no somos Einstein, mantenemos la X.) 


Forma matricial de un paso de eliminación 

Hasta el momento, se ha utilizado una abreviatura conveniente Ax — b para denotar el sis¬ 
tema de ecuaciones original. Pero, ¿qué hay respecto de las operaciones que se realizan du¬ 
rante la eliminación? En nuestro ejemplo, en el primer paso se restó 2 veces la primera 
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ecuación de la segunda. En el miembro derecho, 2 veces la primera componente de b se 
restó de la segunda componente. Se obtiene ei mismo resultado si b se multiplica por esta 
matriz elemental (o matriz de eliminación ): 

"10 0 ' 

Matriz elemental E = —2 1 0 . 

0 0 1 

Lo anterior se comprueba simplemente obedeciendo la regla para multiplicar una matriz y 
un vector: 



Las componentes 5 y 9 siguen siendo las mismas (debido a los 1, 0, 0 y 0, 0, 1 en los ren¬ 
glones de E ). La nueva segunda componente, —12, apareció después del primer paso de 
eliminación. 

Es fácil describir las matrices como E, que llevan los pasos de eliminación por sepa¬ 
rado. También se observa la “matriz identidad”, que no hace absolutamente nada. 


! B La maíríz identidad /, con I s en st diagonal y Os en el resto, deja sin cambio a 
todos los vectores. La matriz elemental E.-.- resta £ veces el renalón i del pensión i. 



‘1 0 0 ] [10 0 ] [ b x 

7=010 tiene Ib — b E-¡\ = 010 tiene E 3 \b = b 2 

0 0 1J [ ~ ¿ 0 \b 3 -ib x 

Ib = b es la matriz análoga a multiplicar por 1. Un paso de eliminación típico multiplica 
por E 3l . La pregunta importante es: ¿Qué ocurre en el miembro izquierdo de Al 

Para preservar la igualdad, es necesario realizar las mismas operaciones en ambos 
miembros de Ax — b. En otras palabras, también el vector Ax debe multiplicarse por la 
matriz E. Nuestra matriz original E resta 2 veces la primera componente de la segunda. 
Después de este paso, el nuevo sistema más sencillo (equivalente al anterior) es justa¬ 
mente E(Ax) — Eb. Es más sencillo debido al cero que se creó abajo del primer pivote. 
Es equivalente porque es posible recuperar el sistema original (sumando 2 veces la pri¬ 
mera ecuación de regreso a la segunda). Así, ambos sistemas tienen exactamente la mis¬ 
ma solución x. 


Multiplicación de matrices 

Ahora hemos llegado a la pregunta más importante: ¿Cómo se multiplican las matrices1 
Hay una pista parcial de la eliminación gaussiana: Se conoce la matriz de coeficientes ori¬ 
ginal A, se conoce la matriz de eliminación E, y se conoce el resultado EA después del pa¬ 
so de eliminación. Deseamos y esperamos que 

1 0 01 multi- [211] [ 2 1 1" 

E = -2 1 0 plicado A = 4-6 0 P ro P or ' EA = 0 -8 -2 . 

0 0 Ij por [-2 7 2j C1 ° na [-2 7 2 

Dos veces el primer renglón de A se ha restado del segundo renglón. La multiplicación de 
matrices es consistente con las operaciones por renglones de eliminación. El resultado pue- 
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de escribirse como E(Ax) = Eb, aplicando E a ambos miembros de la ecuación, o como 
(EA)x = Eb. La matriz EA se construye exactamente de modo que estas ecuaciones coin¬ 
cidan, por lo que no se requieren paréntesis: 

Multiplicación de matrices (EA multiplicada por x) es igual a (E multiplicada por Ax). 
Simplemente se escribe EAx. 

Esta es toda la cuestión de una “ley asociativa” como 2 X (3 X 4) = (2 X 3) X 4. La ley 
parece tan evidente que es difícil imaginar que podría ser falsa. Pero lo mismo puede de¬ 
cirse de la “ley conmutativa” 2X3 = 3X2;y para matrices, se tiene que EA no es AE. 

Para la multiplicación de matrices hay otro requerimiento. Se sabe cómo multiplicar 
Ax, una matriz y un vector. La nueva definición debe ser consistente con esta definición. 
Cuando una matriz B sólo contiene una simple columna x, el producto matriz-matriz AB 
debe ser idéntico al producto matriz-vector Ax. Más aún: Cuando B contiene varias colum¬ 
nas b x ,b 2 , b 3 , ¡las columnas de AB deben ser Ab x , Ab 2 , A¿> 3 ! 

Multiplicación por columnas AB = A [ ¿>i b 2 ¿ 3 ] = [A 61 Ab 2 Ab 3 ]. 

El primer requerimiento tenía que ver con renglones, y éste concierne a columnas. Un 
tercer método es describir cada elemento individual en AB y esperar lo mejor. De hecho, 
sólo hay una regla posible, aunque no estoy seguro de quién la descubrió. Hace funcionar 
todo. No permite la multiplicación de cualquier par de matrices. Si son cuadradas, deben 
tener el mismo tamaño. Si son rectangulares, no deben tener la misma forma; el número 
de columnas en A debe ser igual al número de renglones en B. Así, A puede multiplicar¬ 
se por cada columna de B. 

Si A es m por n, y B es n por p, entonces la multiplicación es posible. El producto AB 
es una matriz de m por p. A continuación se encontrará el elemento en el renglón i y co¬ 
lumna j de AB. 

1C El elemento i, j de AB es el producto internó del i-ésimo renglón de A y lay-ési- 
ma columna de B. En la figura 1.7, el elemento 3, 2 de AB proviene del renglón 3 y 
■ la columna 2: .. . : 

' / (AB) }2 = a 3 l b l2 + a 32 b 22 + a 33 b 32 + <234642- (6) 


Renglón 

multiplicado AB = 
por columna 



Figura 1,7 Una matriz A de 3 por 4, multiplicada por una matriz B de 4 por 2, es una ma¬ 
triz AB de 3 por 2. 


Nota Se escribe AB cuando las matrices no tienen nada especial que hacer con la elimi¬ 
nación. El primer ejemplo era EA debido a la matriz elemental E. Después se tiene PA, o 
LU, e incluso LDU. La regla para la multiplicación de matrices permanece igual. 
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Ejemplo 1 


AB 


2 3 12 0 

405-1 0 


'17 1 0' 

4 8 0’ 


El elemento 17 es (2)(1) + (3)(5), el producto interno del primer renglón de A y la pri¬ 
mera columna de B. El elemento 8 es (4)(2) 4- (0)(— 1), el producto interno del segundo 
renglón y la segunda columna. 

La tercera columna es cero en B, por lo que es cero en AB. B consta de tres colum¬ 
nas una junto a la otra, y A multiplica cada columna por separado. Cada columna de AB 
es una combinación de las columnas de A. Así como en la multiplicación matriz-vector, 
las columnas de A se multiplican por los elementos de B. 


Ejemplo 2 Matriz de intercambio de renglones 

Ejemplo 3 Los ls en la matriz identidad I dejan igual a la matriz: 

Matriz identidad 1A = A y Bl = B. 

Importante: La multiplicación AB también puede efectuarse renglón por renglón. En 
el ejemplo 1, el primer renglón de AB utiliza los números 2 y 3 del primer renglón de A. 
Con estos números se obtiene 2 [renglón 1] + 3 [renglón 2] = [17 1 0]. Exactamente co¬ 
mo en la eliminación, donde empezó todo esto, cada renglón de AB es una combinación 
de los renglones de B. 

A continuación se resumen estas tres formas de considerar la multiplicación de ma¬ 
trices. 


0 1 [2 3 

10 7 8 



Cada elemento de AB es el producto de un renglón y una columna-. 

(AB)¡j = (renglón i de A) multiplicado por la (columna j de B) 
i Cada columna de AB es el producto de una matriz y una columna: 

columna y de AB — A multiplicada por la (columna j de B) 

) Cada renglón de AB es el producto de un renglón y una matriz: 

renglón i de AB = (renglón i de A) multiplicado por B 1 ' i 


Esto nos recuerda a una propiedad clave de la multiplicación de matrices. Suponga 
que las formas de tres matrices A, B, C (quizá rectangulares) permiten su multiplicación. 
Los renglones en A y B se multiplican por las columnas de B y C. Así, la propiedad clave 
es la siguiente: 


1E Lamultipiicac ó den - es es asociativa, 

plemente ABC. 


AB multiplicado por C es igual a A multiplicado por BC. Si ocurre que C es simplemente 
un vector (una matriz con una sola columna), este es el requerimiento {EA)x = E(Ax) ya 
mencionado. Esto constituye toda la base para las leyes de la multiplicación de matrices. 
Y si C consta de vanas columnas, basta pensar que éstas se encuentran una junto a la otra, 
y aplicar la misma regla varias veces. Cuando se multiplican varias matrices no se requie¬ 
ren paréntesis. 


í'-'r-.-. «'--XCMKrv' ;--r "v»-v- I ~ i ri fi ffh 1 11| f ^ >' * 1 i tj l W *!■ i'i A P-W- - V'." A'” «T"' 
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Queda por mencionar otras dos propiedades: una que posee la multiplicación de ma¬ 
trices, y otra que no posee. La primera es: 



Por supuesto, las formas de estas matrices deben corresponder correctamente: B y C 
tienen la misma forma, de modo que es posible sumarlas, y Ay D son del tamaño idóneo 
para la multiplicación por la izquierda y por la derecha. La demostración de esta ley es de¬ 
masiado tediosa como para escribirla. 

La propiedad que no se cumple para la multiplicación de matrices es un poco más in¬ 
teresante: 

1G ■ La multiplicación de ma r ees no .5 era nutativa Je- sie ipre FE A EF. 

Ejemplo 4 Suponga que E resta dos veces la primera ecuación de la segunda. Suponga que F es la ma¬ 
triz del siguiente paso, sumar el renglón 1 al renglón 3: 


1 

0 

0' 

ri 

0 

0' 

E = -2 

1 

0 

o 

li 

k 

i 

0 

0 

0 

1 

L 1 

0 

1 


Estas dos matrices conmutan, y el producto efectúa ambos pasos al mismo tiempo: 

'10 0 ' 

EF = —2 1 0 = FE. 

1 0 i 

En cualquier orden, EF o FE, así se cambian los renglones 2 y 3 usando el renglón 1. 

Ejemplo 5 Suponga que E es la misma pero que G suma el renglón 2 al renglón 3. Ahora el orden es¬ 
tablece una diferencia. Cuando se aplica E y luego G, el segundo renglón está modificado 
antes de afectar al tercero. Si E se aplica después de G, entonces la tercera ecuación no su¬ 
fre ningún efecto del primero. En el elemento (3,1) de EG se verá un cero, mientras en GE 
hay un -2: 

'i o oí r i o oí r i o oí r i o o' 

GE =010 —2 10= —210 pero EG =—210. 

0 1 lj L o o lj 1-2 1 lj L 0 1 l - 

Así, EG ¥= GE. Un ejemplo aleatorio mostraría el mismo hecho: la mayor parte de las ma¬ 
trices no conmutan. Aquí las matrices tienen sentido. Hay una razón por la cual EF = FE, 
y otra por la cual EG A GE. Merece la pena realizar otro paso, para ver lo que ocurre con 
las tres matrices de eliminación a la vez: 


1 

0 

0' 

1 

0 

0' 

GFE = -2 

1 

0 y 

EFG = -2 

1 

0 

-1 

1 

1 

1 

1 

1 


El producto GFE es el verdadero orden de eliminación. Es la matriz que lleva la matriz ori¬ 
ginal A a la triangular superior U. Este hecho se verá de nuevo en la siguiente sección. 

La otra matriz, EFG, es más agradable. En ese orden, los números -2 de E y 1 de f y 
G no fueron alterados. Se escribieron igual en el producto. Es el orden incorrecto para la 
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eliminación. Pero por fortuna, se trata del orden correcto para invertir los pasos de elimi¬ 
nación, lo cual también se verá en la siguiente sección. 

Observe que el producto de matrices triangulares inferiores también es triangular in¬ 
ferior. 


Conjunto de problemas 1.4 

1. Calcule los productos 

'4 0 1] [3' 

0 1 0 4 3 

4 0 1 5 


1 0 0 
0 1 0 
0 0 1 


Para el tercero, trace los vectores columna (2, 1) y (0, 3). La multiplicación por (1, 1) 
simplemente suma los vectores (hágalo gráficamente). 

2. Trabaje con una columna a la vez para calcular los productos 

'4 ll r , fl 2 3l f0l [4 3] rr 

5 1 y 4 5 6 1 y 6 6 2 . . 

6 lj L -I [7 8 9J [oj |_8 9J 13. 

3. Encuentre dos productos internos y un producto de matrices: 


Con el primero se obtiene la longitud del vector (al cuadrado). 

4. Si una matriz A de m por n multiplica a un vector n dimensional x, ¿cuántas multipli¬ 
caciones por separado están implicadas? ¿Qué ocurre si A multiplica a una matriz B de 
n por p? 

5. Multiplique Ax para encontrar un vector solución x del sistema Ax = vector cero. ¿Pue¬ 
de encontrar más soluciones para Ax = 0? 

'3 -6 0] [2' 

Ax = 0 2-2 1 . 

! -1 -lj [1 

6. Escriba las matrices A y B de 2 por 2 cuyos elementos son a u — i + j y by — (-1)' +J . 
Multiplxquelas para encontrar AB y BA. 

7. Proporcione ejemplos de 3 por 3 (no sólo la matriz cero) de 

a) una matriz diagonal: ay = 0 si i t 4 j. 

b) una matriz simétrica: a tj = aj¡ para toda i y j. 

c ) una matriz triangular superior: ay = 0 si i > j. 

d) una matriz simétrica sesgada: ay = —aj¡ para toda i y j. 

8. Las siguientes subrutinas, ¿multiplican Ax por renglones o por columnas ? Empiece 
con B(I) = 0: 

DO 10 I = 1,N DO 10 J = 1,N 

DO 10 J = 1,N DO 10 I = 1,N 

10 B(I) = B(I) + A(IJ) * X(J) 10 B(I) = B(I) + A(I,J) * X(J) 


1.4 Notación matriciai y muitipíicaciófrde 
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Las salidas Bx = Ax son las mismas. El segundo código es ligeramente más eficaz en 
FORTRAN, y mucho más eficaz en una máquina vectorial (el primero cambia los ele¬ 
mentos simples B (/), mientras el segundo es capaz de actualizar vectores completos). 

9. Si los elementos de A son a ip use notación de subíndices para escribir 

a) El primer pivote. 

b) El multiplicador l n del renglón 1 que debe restarse del renglón i. 

c) El nuevo elemento que sustituye a ay después de la sustracción. 

d) El segundo pivote. 

10. ¿Falso o verdadero? Cuando sea falso, proporcione un contraejemplo. 

a) Si las columnas 1 y 3 de B son las mismas, también las columnas 1 y 3 de AS son 
las mismas. 

b) Si los renglones 1 y 3 de B son los mismos, también los renglones 1 y 3 de AS son 
los mismos. 

c) Si los renglones 1 y 3 de A son los mismos, también los renglones 1 y 3 de AS son 
los mismos. 

d) (AB) 2 = A 2 B 2 . 

11. El primer renglón de AS es una combinación lineal de todos los renglones de S. ¿Cuá¬ 
les son los coeficientes en esta combinación? y ¿cuál es el primer renglón de AB, si 


12. El producto de dos matrices triangulares inferiores es nuevamente triangular inferior 
(todos sus elementos arriba de la diagonal principal son cero). Confirme esto con un 
ejemplo de 3 por 3, y luego explique por qué este hecho se deduce a partir de las le¬ 
yes de la multiplicación de matrices. 

13. Por ensayo y error, encuentre ejemplos de matrices de 2 por 2 tales que 

a) A 2 = —I, donde A sólo tiene elementos reales. 

b) B 2 — 0, aunque B 0. 

c) CD = —DC, no permitiendo el caso CD = 0. 

d) EF = 0, aunque ningún elemento de E o F es cero. 

14. Describa los renglones de EA y las columnas de A£ si 

_ n 7i 


15. Suponga que A conmuta con toda matriz de 2 por 2 (AB — BA), y en particular 

, U b] , o [1 01 D [0 r 

A = c d conmuta con B¡ = Q Q y B 2 =q 0 - 


Demuestre que a — d y b = c = 0. Si AB — BA para todas las matrices B, entonces A 
es un múltiplo de la identidad. 

16. Sea x el vector columna (1, 0,.... 0). Demuestre que la regla (AB)x = A(Bx ) obliga a 
que la primera columna de AB sea igual a A multiplicada por la primera columna de B. 

17. ¿Cuál(es) de la(s) siguiente(s) matrices garantizan ser iguales a (A + B) 2 ? 

A 2 +2AB + B 2 , A(A + B) + B(A + B), ( A + B )(B + A), A 2 +AB+BA + B 1 . 
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18. Si A y B son matrices de n por n con todos los elementos iguales a 1, encuentre ( AB)y. 
La notación de la sumatoria transforma el producto AB, y la ley ( AB)C = A(BQ, en 


E a ‘ kb t 




Calcule ambos miembros de C si también es de n por n, con todo Cj¡ — 2. 

19. Una cuarta forma de multiplicar matrices es multiplicando las columnas de A por los 
renglones de B: 

AB = (columna l)(renglón 1) + • • • + (columna «((renglón «) = suma de matrices 
simples. 

Proporcione un ejemplo de 2 por 2 de esta importante regla para la multiplicación de 
matrices. 

20. La matriz que rota el plano x-y en un ángulo 6 es 

.... I"eos 6 —sen 9' 

A(6) = . „ . 

sen 0 eos 9 

Compruebe que A{6 l )A{9 2 ) = A(0 t + 0 2 ) a partir de las identidades para cos(0, + 9 2 ) 
y sen^ + 0 2 ). ¿A qué es igual A{9) multiplicada por A(—0)? 

21. Encuentre las potencias A 2 , A 3 (A 2 multiplicada por A), y B 2 , B 3 , C 2 , C 3 . ¿Qué son A k 
B k y C*? 


1 0 
0 -1 


C = AB = 


Los problemas 22 a 31 son sobre matrices de eliminación. 

22. Escriba las matrices de 3 por 3 que producen los siguientes pasos de eliminación: 

a) E 2¡ resta 5 veces el renglón 1 del renglón 2. 

b) E 32 resta -7 veces el renglón 2 del renglón 3. 

c) P intercambia los renglones 1 y 2, y luego los renglones 2 y 3. 

23. En el problema 22, al aplicar E 2l y luego E 32 a la columna b = (1, 0, 0) se obtiene 

E 37.E 2 \b =-■ Al aplicar E 32 antes que E 21 se obtiene E 2l E 32 b =_. Cuando 

se aplica primero E 32 , el renglón_no se ve afectado por el renglón_. 

24. ¿Cuáles son las tres matrices E 2l ,E 3l , E 32 que hacen de A una forma triangular £/? 


1 1 0 
4 6 1 
-2 2 0 


E 32E 3 tE2lA — U. 


Multiplique estas matrices E para obtener una matriz M que haga la eliminación- 
MA = U. 

25. Suponga que a 33 = 7 y que el tercer pivote es 5, Si a 33 se cambia a 11, el tercer pivo¬ 
te es_.. Si a 33 cambia a __, en la posición pivote hay un cero. 

26. Si cada columna de A es un múltiplo de (1, 1, 1). entonces Ax siempre es un múltiplo de 
(1,1, I)- Escriba un ejemplo de 3 por 3. ¿Cuántos pivotes se producen por eliminación? 

27. ¿Qué matriz E 3l resta 7 veces el renglón 1 del renglón 3? Para invertir este paso, R 33 

debe-7 veces el renglón_al renglón_. Multiplique E 31 por R 3l , 
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28. a) E 21 resta el renglón 1 del renglón 2 y luego P 23 intercambia los renglones 2 y 3. 

¿Qué matriz M = P 23 E 2X realiza ambos pasos a la vez? 
b ) P 23 intercambia los renglones 2 y 3 y luego E 3l resta el renglón 1 del renglón 3. 
¿Qué matriz M = E 31 P 23 realiza ambos pasos a la vez? Explique por qué las ma¬ 
trices M son las mismas pero las matrices E son distintas. 

29. a) ¿Qué matriz E l3 de 3 por 3 suma el renglón 3 al renglón 1? 

b) ¿Qué matriz suma el renglón 1 al renglón 3 y al mismo tiempo suma el renglón 3 al 
renglón 1? 

c ) ¿Qué matriz suma el renglón 1 al renglón 3 y luego suma el renglón 3 al renglón 1? 

30. Multiplique las siguientes matrices: 

"0 0 l] Fl 2 3] [0 0 ll F i 0 0] Fl 2 3' 

010 456 010 y -110 131. 

1 0 oj [7 8 9J [l 0 OJ [-1 0 1 j [_i 4 0 

31. ¿Cuáles matrices de eliminación E 2X , £32 Y £43 requieren la siguiente matriz de 4 por 4? 

‘2-1 0 0' 

-1 2-1 0 

A 0-1 2 -1 ' 

0 0-12 

Los problemas 32 a 44 son sobre la obtención y multiplicación de matrices. 

32. Escriba estos problemas clásicos en forma matricial de 2 por 2 para Ax = b y resuél¬ 
valos: 

a ) X es dos veces más viejo que y y la suma de la edad de ambos es igual a 39. 

b) (x, y) = (2, 5) y (3, 7) está en la recta y = mx + c. Encuentre my c. 

33. La parábola y - a + bx + ex 2 pasa por los puntos (x, y) = (1, 4) y (2, 8) y (3, 14). 
Encuentre y resuelva una ecuación matricial para las incógnitas (a, b, c). 

34. Multiplique las siguientes matrices en los órdenes EF, FE y E 2 . 


’1 

0 

0' 

'1 

0 

0' 

E — a 

1 

0 

F = 0 

1 

0 

_b 

0 

1 

0 

c 

1 


35. a) Suponga que todas las columnas de B son las mismas. Entonces todas las colum¬ 

nas de EB son las mismas, ya que cada una es E multiplicada por_. 

b) Suponga que todos los renglones de B son [1 2 4]. Demuestre con un ejemplo que 
todos los renglones de EB no son [1 2 4], Es cierto que todos estos renglones son 

36. Si E suma el renglón 1 al renglón 2, y F suma el renglón 2 al renglón 1, ¿es cierto que 
EF es igual a FE1 

37. La primera componente de Ax es Z ay Xj = a n x l + • • • + a ln x n . Escriba fórmulas 
para la tercera componente de Ax y el elemento (1, 1) de A 2 . 

38. Si AB = / y BC = /, aplique la ley asociativa para demostrar que A = C. 

39. A es 3 por 5, B es 5 por 3, C es 5 por 1, y D es 3 por 1. Todos los elementos son 1. 
¿Cuáles de las siguientes operaciones matriciales son permitidas, y cuáles son los re¬ 
sultados? 

BA AB ABD DBA A(B + C). 
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40. ¿Qué renglones, columnas o matrices es necesario multiplicar para encontrar, 

a) la tercera columna de AB? 

b) el primer renglón de AS? 

c) el elemento en el renglón 3, columna 4 de AB? 

d) el elemento en el renglón 1, columna 1 de CDE2 

41. (Matrices de 3 por 3) Escoja la única B de modo que para toda matriz A, 

a) BA = 4A. 

b) BA = 4B. 

c) BA tiene invertidos los renglones 1 y 3 de A y el renglón 2 sin cambio. 

d ) Todos los renglones de BA son los mismos que el renglón 1 de A. 

42. ¿Falso o verdadero? 

a) Si A 2 está definida, entonces A es necesariamente cuadrada. 

b) Si AB y BA están definidas, entonces Ay B son cuadradas. 

c) Si AB y BA están definidas, entonces AB y BA son cuadradas. 

d) Si AB = B, entonces A = I. 

43. Si A es de m por n, ¿cuántas multiplicaciones por separado están implicadas si 

a ) A multiplica un vector x con n componentes? 

b) A multiplica una matriz B de n por p? Entonces AB es m por p. 

c) A se multiplica a sí misma para producir A 2 ? Aquí m = n. 

44. Para demostrar que (AB)C = AiBC), use los vectores columna b u ■ ■ ■ , b„ de B. Pri¬ 
mero suponga que C tiene una sola columna c con elementos c u ■ ■ •, c n : 

AB tiene columnas Ab u • • • , Ab„ y Be tienen una columna c l b l + • • • + c n b n . 
Entonces (AB)c = ^ABj + ■ ■ ■ + c n Ab n es igual a A(c l b 1 + ■ ■ • + c n b n ) = A(Bc). 
La linealidad proporciona la igualdad de estas dos sumas, y (AB)c = A(Bc). Lo mis¬ 
mo es cierto para todos (todas) los (las)_de C. En consecuencia, (AB)C = A(BC). 



En los problemas 45 a 49 se utiliza multiplicación columna-renglón, y multiplicación 

en bloque. 


45. Multiplique AB usando multiplicación de columnas por renglones: 


46. La multiplicación en bloque separa las matrices en bloques (submatrices). Si sus for¬ 
mas hacen posible la multiplicación en bloque, entonces es permitida. Sustituya las si¬ 
guientes x por números, y confirme que la multiplicación en bloque es exitosa. 



47. Trace los cortes en A y B y AB para mostrar cómo cada una de las cuatro reglas de la 
multiplicación es en realidad una multiplicación en bloque para encontrar AB: 

a) La matriz A multiplicada por las columnas de B. 

b ) Los renglones de A multiplicados por la matriz B. 




Cl. UHUUUrtT 

~ I 0 A fJ ACION AL 

1.4. Motaciórtmatricial y multiplicación de matrices 
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c) Los rengloHes^de.A.:multiplieadGSiponfeuvcoiumnas de B. 

d) Las columnas de A multiplicadas por los renglones de B. 

48. La multiplicación en bloque indica que la eliminación en la columna 1 produce 


49. Eliminación para una matriz en bloque de 2 por 2: Cuando A ~ l A = /, el primer ren¬ 
glón en bloque se multiplica por CA~ l y se resta del segundo renglón, para encontrar 
el “ complemento de Schur" S : 

/ 0] [A B] = [A B~ 

—CA~ l /j [C D\ L° 5 .‘ 

50. Con z 2 = -1, el producto (A + iB)(x + iy) es Ax + iBx + iAy - By. Use bloques pa¬ 

ra separar la parte real de la parte imaginaria que multiplica i: 

'A -B] |Y1 _ [Ax-By] parte real 
? ? y ? parte imaginaria 

51. Suponga que resuelve Ax = b para tres miembros derechos especiales de b: 

’il [0] Í0' 

Axi =0 y Ax 2 = 1 y Ax 3 = 0 . 

OJ |oJ L 1 . 

Si las soluciones x 1( x 2 , x 3 son las columnas de una matriz X, ¿qué es AX? 

52. Si las tres soluciones en el problema 51 son x t = (1, 1, 1) y x 2 = (0, 1, 1) y * 3 - 
(0, 0, 1), resuelva Ax = b cuando b = (3, 5, 8). Pregunta de desafío: ¿Qué es A? 

53. Encuentre todas las matrices 

A = a j que satisfacen A J f = f í A. 

cd [1 1J [1 i 

54. Si una matriz noroeste A se multiplica por una matriz sureste B, ¿qué tipo de matrices 
son AB y BA? “Noroeste” y “sureste” significa ceros abajo y arriba de la antidiagonal 
que va de (1, n) a (n, 1). 

55. Escriba 2x + 3y + z + 5f = 8 como una matriz A (¿cuántos renglones tiene?) multi¬ 
plicando el vector columna (x, y, z, t) para obtener b. Las soluciones llenan un plano 
en el espacio tetradimensional. El plano es tridimensional sin volumen de 4-dimensio- 
nes. 

56. ¿C uál es la matriz P¡ de 2 por 2 que proyecta el vector (x, y) sobre el eje x para produ¬ 

cir (x, 0)? ¿Cuál es la matriz P 2 que proyecta el vector (x, y) sobre el eje y para producir 
(0, y)? Si se multiplica (5,7) por P, y luego se multiplica por P 2 , se obtienen (_) y 


57. Escriba el producto interno de (1, 4, 5) y (x, y, z) como una multiplicación de matrices 

Ax. A tiene un renglón. Las soluciones de Ax = 0 están en un_perpendicular al 

vector_. Las columnas de A sólo están en el espacio_dimensional. 

58. En notación de M ATLAB, escriba los comandos que definen la matriz A y los vecto¬ 
res columna x y b. ¿Cuál es el comando que prueba si Ax = b o no? 


A = 


1 2 
3 4 


x 


5 

2 
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59. Los comandos MATLAB A = eye(3) y v = [3:5]' producen la matriz identidad de 3 
por 3 y el vector columna (3, 4, 5). ¿Cuáles son las salidas de A * v y v’ * v? (¡No se 
requiere computadora!) Si pregunta por v * A, ¿qué ocurre? 

60. Si la matriz de 4 por 4 integrada sólo por unos A = ones(4, 4) se multiplica por la co¬ 
lumna v = ones(4, 1), ¿qué es A * v? (No se requiere computadora) Si B = eye(4) 
+ ones(4, 4) se multiplica por w = zeros(4, 1) + 2* ones(4, 1), ¿qué es B * w? 

61. Escriba una matriz mágica M de 3 por 3 con elementos 1, 2,..., 9. La suma de to¬ 
dos los elementos de los renglones, de las columnas y de la diagonal debe ser igual a 
15. El primer renglón podría ser 8, 3, 4. ¿Cuánto es M por (1, 1, l)?¿Aqué es igual el 
vector renglón [1, 1, 1] multiplicado por MI 

1.5 FACTORES TRIANGULARES E INTERCAMBIOS DE RENGLONES 

Se desea considerar nuevamente la eliminación para ver lo que significa en términos de 

matrices. El punto de partida fue el sistema modelo Ax — b: 


Ax = 



1 

0 


2 




( 1 ) 


Luego había tres pasos de eliminación, con multiplicadores 2, — 1, — 1: 

Paso 1. Restar 2 veces la primera ecuación de la segunda. 

Paso 2. Restar -1 vez la primera ecuación de la tercera. 

Paso 3. Restar -1 vez la segunda ecuación de la tercera. 

El resultado era un sistema equivalente Ux = c, con una nueva matriz de coeficientes U: 


"2 1 1 

Triangular superior Ux = 0 —8 —2 

0 0 1 




( 2 ) 


Esta matriz U es triangular superior: todos los elementos debajo de la diagonal son cero. 

El nuevo miembro derecho c se obtuvo a partir del vector original b siguiendo los mis¬ 
mos pasos que llevan de A a U. La eliminación hacia adelante equivale a tres operaciones 
en renglones: 


Empezar con Ay b; 

Aplicar los pasos 1, 2, 3 en ese orden; 

Terminar con U y c. 

Ux = c se resuelve por sustitución hacia atrás. Aquí nos centramos en relacionar A con U. 

Las matrices E para el paso 1, F para el paso 2, y G para el paso 3 se presentaron en 
la sección precedente. Se denominan matrices elementales, y es fácil ver cómo trabajan. 
Para restar un múltiplo i de la ecuación / de la ecuación i, el número —t se escribe en la 
posición ( i,jj. En caso contrario, se preserva la matriz identidad, con Is en la diagonal y Os 
Juera de ésta. Luego, la multiplicación de matrices realiza la operación en los renglones. 



trar una simple matriz que lleve A a U (y también b a c). Es una matriz triangular inferior 
(se omiten los ceros): 

T 

De A ai/ GFE = 1 

1 1 

Esto es bueno, pero la pregunta más importante es exactamente lo opuesto: ¿Cómo puede 
regresarse de U a A? ¿Cómo pueden deshacerse los pasos de la eliminación gaussiana? 

Deshacer el paso 1 no es difícil. En lugar de restar, se suma dos veces el primer ren¬ 
glón al segundo. (¡No dos veces el segundo renglón al primero!) El resultado de realizar 
tanto la sustracción como la adición es recuperar la matriz identidad: 



La inversa de [l 0 0] f 1 0 0] f 1 0 0' 

la sustracción 2 10 -210 = 010. (4) 

es la adición 0 0 1 0 0 1 0 0 1 

Una operación cancela la otra. En términos matriciales, una matriz es la inversa de la otra. 
Si la matriz elemental E contiene al número —l en la posición (i, j), entonces la inversa 
ET l contiene a +1 en esa posición. Por tanto, E~ l E — I, que es la ecuación (4). 

Cada paso de la eliminación puede invertirse, usando E~ 1 y F~ 1 y G~~ 1 . Considero que 
no es malo abordar las inversas ahora, antes de la siguiente sección. El problema final es 
deshacer todo el proceso de una vez, y ver qué matriz regresa U a A. 

Debido a que el paso 3 fue el último yendo de A a U, su matriz G debe ser la prime¬ 
ra en ser invertida en la dirección opuesta. ¡Las inversas se presentan en orden opuesto! 
El segundo paso en reversa es F~ l y el último es ET l : 

Regreso a A desde U E~'F~ l G~ 1 U=A es LU = A. (5) 

Es posible sustituir GFE A por U con la finalidad de ver, cómo las inversas eliminan los pa¬ 
sos originales. 

Luego se reconoce la matriz L que regresa U a A. Se denomina L porque es triangu¬ 
lar inferior. Y posee la propiedad especial de que sólo puede verse, multiplicando las tres 
matrices inversas en el orden correcto: 

í 1 

1 =21 — L. (6) 

-1 1J [-1 -1 1 

La cuestión especial es que los elementos abajo de la diagonal son los multiplicadores 
t = 2, — 1, y —1. Cuando se multiplican matrices, suele no haber una forma directa de leer 
la respuesta. Aquí las matrices se presentan justo en el orden correcto, de modo que su pro¬ 
ducto puede escribirse de i nm ediato. Si la computadora almacena cada multiplicador í lp el 
número que multiplica el renglón pivote j cuando se resta del renglón i y produce un cero 
en la posición i, j, entonces estos multiplicadores proporcionan un registro completo de la 
eliminación. 

Los números l¡j tienen cabida perfecta en la matriz L que lleva U de nuevo a A. 

1H Factorización triangular A — LU sin intercambio de renglones. L es triangu¬ 
lar inferior, con 1 s en la diagonal. Los multiplicadores tq (tomados de la eliminación) 
están debajo de la diagonal. U es la matriz triangular superior que aparece después 
de la eliminación hacia adelante. Los elementos en la diagonal de U son los pivotes. 
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Ejemplo 1 


' i 21 se f i 21 10 

A = transforma U = n _ con í, = „ . Luego, Lt/ = A. 


Ejemplo 2 Lo cual necesita un intercambio de renglones 


0 2 

A = no puede factorizarse en A = Li/. 

3 4 


Ejemplo 3 (con todos los pivotes y multiplicadores iguales al) 


1 1 1 

A = 1 2 2 

1 2 3 


10 0 Fl 1 1 

110 0 11 
111 0 0 1 


De A a U hay restas de renglones. De U a A hay sumas de renglones. 
Ejemplo 4 (cuando [/ es la identidad y Z. es la misma que A) 


Caso triangular inferior 


A — ¿21 

¿31 


0 0 
1 o 

¿32 1 


Los pasos de eliminación en esta A son fáciles: i) E resta ¿ 2 i veces el renglón 1 del renglón 
2, ii) F resta ¿ 3l veces el renglón 1 del renglón 3, y iii) G resta ¿ 32 veces el renglón 2 del 
renglón 3. El resultado es la matriz identidad U = I. Las inversas de E, F, y G producen de 
regreso A: 


E 1 aplicada a F 1 aplicada a G 1 aplicada a I produce A. 


1 ' Multi- 

¿21 1 plicada 

1 por 


Muid- 1 
plicada 
por 


1 

¿32 1 


es 10 0 

igual ¿21 1 0 

a ¿31 ¿32 1 


El orden es correcto para que los ¿s estén en su posición. ¡Esto ocurre siempre! Observe 
que los paréntesis en e~ 1 F~ 1 G~ 1 no fueron necesarios debido a la ley asociativa. 

A = LU: El caso n por n 

La factorización A = LU es tan importante que es necesario comentar más acerca de ella. 
Normalmente se la ignoraba en cursos de álgebra lineal cuando la orientación de éstos era 
la parte abstracta. O quizá se pensaba que era demasiado difícil, pero es necesario abordarla. 
Si el último ejemplo 4 permite cualquier U en vez de la U particular U = I, es posible perca¬ 
tarse de cómo trabaja la regla en general. La matriz L, aplicada a U, regresa A: 


■ 1 

0 

0' 

renglón 1 de U 


^21 

i 

0 

renglón 2 de U — A original. 

(7) 

L^31 ^32 

1 

renglón 3 de U 



1.5 Factores triangulares e intercambios de renglones 


jM 


La demostración es aplicar los pasos de eliminación. En el miembro derecho, éstos llevan 
A a U. En el miembro izquierdo reducen La I, como en el ejemplo 4. (El primer paso res¬ 
ta £ 2 i veces (1, 0, 0) del segundo renglón, con lo cual se elimina ¿ 21 .) Ambos miembros 
de (7) terminan iguales a la misma matriz U, y todos los pasos para llegar ahí son reversi¬ 
bles. En consecuencia (7) es correcta y A = LU. 

A = LU es tan crucial, y tan bella, que el problema 8 al final de esta sección sugiere 
un segundo método. Aquí se están escribiendo matrices de 3 por 3, aunque el lector puede 
darse cuenta de la forma en que los razonamientos se aplican a matrices más grandes. 
A continuación se proporciona otro ejemplo, y luego se empieza a utilizar A = LU. 

Ejemplo 5 (A = LU, con ceros en los espacios vacíos) 



Esto demuestra cómo una matriz A con tres diagonales tiene factores L y U con dos diago¬ 
nales. Este ejemplo proviene de un problema importante en ecuaciones diferenciales (véa¬ 
se la sección 1.7). La segunda diferencia en A es la diferencia hacia atrás L multiplicada 
por una diferencia hacia adelante U. 


Un sistema lineal = Dos sistemas triangulares 

Hay un punto práctico importante que mencionar sobre A = LU. Es más que un simple re¬ 
gistro de pasos de eliminación; L y U son las matrices derechas para resolver Ax = b. De 
hecho, ¡es posible descartar a A! De b a c se va por eliminación directa (que utiliza L), y 
de c a x se va por sustitución hacia atrás (que usa U). Esto puede y debe hacerse sin A: 

Separación de Ax = b Primero Le — b y luego Ux = c. (8) 


La segunda ecuación se multiplica por L para obtener LUx = Le, que es Ax = b. Cada sis¬ 
tema triangular se resuelve rápidamente. Esto es exactamente lo que un buen código de eli¬ 
minación hace: 



La separación entre Factoriza y Resuelve significa que es posible procesar una serie de bs. 
La subrutina Resuelve obedece la ecuación (8); dos sistemas triangulares en rc"/2 pasos ca¬ 
da uno. La solución para cualquier miembro derecho nuevo b puede encontrarse en 
sólo n 2 operaciones. Esto es mucho menos que los n 3 f 3 pasos necesarios para factorizar A 
en el miembro izquierdo. 
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Ejjempfo 6 Esta es la matriz previa A con miembro derecho b = (1, 1, 1, 1). 


Ax = b 


Le = b 


Ux = c 


Xi — x 2 =1 

~X ( + 2x 2 — X 3 =1 

— X2 + 2X3 — X4 = 1 
— X 3 + 2x4 = 1 


se separa en Le — b y Ux — c. 


c 1 = 1 

-C\ + C 2 =1 

—C 2 + C 3 =1 

—C 3 + C 4 = 1 

Xl - X 2 =1 

x 2 — x 3 =2 

x 3 — x 4 — 3 

x 4 = 4 


proporciona c 


proporciona x 


Para estas “matrices tridiagonales” especiales, la operación cae desde n 2 hasta 2 n. Usted 
verá cómo Le = b se resuelve hacia adelante (cj viene tintes de c 2 ). Esto es precisamente 
lo que ocurre durante la eliminación hacia adelante. Luego, Ux = c se resuelve hacia atrás 
(x 4 antes de x 3 ). 

Observación 1 La forma LU es “no simétrica” en la diagonal: L tiene ls donde U tiene los 
pivotes. Esto es fácil de corregir: U se divide entre una matriz pivote diagonal D: 


Factorizar D U = 


1 U 12 I d\ UijI d\ 
1 u 22 l d 2 


En el último ejemplo, todos los pivotes eran d¡ = 1. En ese caso D = I. Pero esto fue muy 
excepcional, y normalmente LU es diferente de LDU (lo cual también se escribe como 
LDV ). 


La factorización triangular puede escribirse como A = LDU, donde Ly U tienen 
ls. en la diagonal, y D es la matriz diagonal de pivotes. 


Siempre que se observa LDU o LDV, se entiende que U o V tiene ls en la diagonal: cada 
renglón se dividió entre el pivote en D. Luego, Ly U se tratan de la misma forma. A con¬ 
tinuación se muestra un ejemplo de separación de LU en LDU. 


Lo anterior tiene los ls en las diagonales de L y U, y los pivotes 1 y -2 en D. 

Observación 2 Al describir cada paso de eliminación, quizá dimos la impresión de que los 
cálculos deben realizarse en ese orden. Esto es erróneo. Hay algo de libertad, y hay un “al- 



Intercambios de renglones, y matrices de permutación 

Ahora es necesario enfrentar un problema que se ha evitado hasta el momento: el número 
que se espera utilizar como pivote puede ser cero. Esto puede ocurrir en medio de un cálcu¬ 
lo. Ocurrirá casi al principio si a u = 0. Un simple ejemplo es 

Cero en la posición pivote 


0 2 u 
3 4 v 


La dificultad es evidente; ningún múltiplo de la primera ecuación elimina al coeficiente 3. 

El remedio es igualmente claro. Intercambiar las dos ecuaciones, moviendo el 
elemento 3 hacia el pivote. En este ejemplo, la matriz pudo transformarse en triangu¬ 


lar superior: 


Intercambio de renglones 


3u + 4v = b 2 
2v = bi 


Para expresar esto en términos matriciales, se requiere la matriz de permutación P que 
produce el intercambio de renglones. Se obtiene al intercambiar los renglones de /: 


Permutación 


ro n ro 2" 


P tiene el mismo efecto sobre b, intercambiando ¿q y b 2 . El nuevo sistema es P Ax = Pb. 
Las incógnitas uy v no se invierten en un intercambio de renglones. 

Una matriz de permutación P tiene los mismos renglones que la identidad (en algún 
orden). En cada renglón y columna hay un simple “1”. La matriz de permutación más co¬ 
mún es P = / (no intercambia nada). El producto de dos matrices de permutación es otra 
permutación: los renglones de I se reordenan dos veces. 

Después d eP = I, las permutaciones más sencillas intercambian dos renglones. Otras 
permutaciones intercambian más renglones. Hay ni — (n)(n - 1) • • • (1) permutaciones 
de tamaño n. El renglón 1 tiene n opciones; luego, el renglón 2 tiene n - 1 opciones, y fi¬ 
nalmente el último renglón sólo tiene una opción. Es posible mostrar todas las permutacio¬ 
nes de 3 por 3 (hay 3! = (3)(2)(1) = 6 matrices): 
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Hay 24 matrices de permutación de orden n = 4. Sólo hay dos matrices de permutación de 
orden n = 2; a saber, 

1 0 ] [0 r 

0 1J y [1 0 ' 

Una vez que se conoce sobre inversas y traspuestas (en la siguiente sección se definen 
A~~ ! y A t ), se descubre un hecho importante: P siempre es igual a P T . 

Un cero en la ubicación del pivote origina dos posibilidades: El problema puede ser 
fácil de arreglar, o puede ser grave. Esto se decide al observar abajo del cero. Si más aba¬ 
jo en la misma columna hay un elemento distinto de cero, entonces se realiza un intercam¬ 
bio de renglones. El elemento distinto de cero se convierte en el pivote necesario, y la eli¬ 
minación puede continuar de nuevo: 

0 a b d = 0 => ningún primer pivote 

A = 0 0 c a = 0 => ningún segundo pivote 

d e f c — 0 =>- ningún tercer pivote 

Si d — 0, entonces el problema es incurable y esta matriz es singular. No hay esperanza de 
una solución única de Ax = b. Si d no es cero, un intercambio P l3 de los renglones 1 y 3 
mueve d al pivote. No obstante, la siguiente posición pivote también contiene un cero. El 
número a está ahora abajo del cero (el e arriba del cero es inútil). Si a no es cero, entonces 
se requiere otro intercambio de renglones P 23 : 

'0 0 ll [10 0] Id e /' 

P \ 3 — 0 1 0 y Pa= 0 0 1 y P 23 P¡ 3 A — 0 a b 

_1 0 Oj L° 1 °J L° 0 c 

Una cuestión más: La permutación P 23 P 13 realiza los dos intercambios de renglones 
a la vez: 

'l 0 0 ] [0 0 ll [0 0 r 

P 13 actúa primero P 23 P 13 = 0 0 1 0 1 0 = 1 0 0 = P. 

0 1 0J [1 0 OJ |_0 1 0 _ 

De haberlo sabido, hubiera sido posible multiplicar A por P en primer lugar. Con los ren¬ 
glones en el orden correcto PA, cualquier matriz no singular está lista para el proceso de 
eliminación. 

Eliminación en pocas palabras: PA — LU 

La cuestión más importante es la siguiente: Si la eliminación puede completarse con ayu¬ 
da de intercambios de renglones, entonces es posible suponer que estos intercambios se 
realizan primero (por P). La matriz PA no requiere intercambios de renglones. En otras pa¬ 
labras, PA permite la factorización normal en L multiplicada por U. La teoría de la elimi¬ 
nación gaussiana puede resumirse en unas cuantas líneas: 

1J En el caso no singular, hay una matriz de permutación P que reordena ios ren- 
. glones de A para evitar la presencia de ceros en las posiciones pivote. Así, Ax — b 
tiene una solución única: 

Con los renglones reordenados de antemano, PA puede factorizarse en LU. 

En el caso singular, ninguna P puede producir un conjunto completo de pivotes: la 
: eliminación fracasa. 
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Ejemplo 7 


En la práctica, también es posible considerar un intercambio de renglones cuando el 
pivote original está próximo a cero: aun cuando no sea exactamente igual a cero. Cuando 
se elige un pivote más grande se reduce el error por redondeo. 

Debe tenerse cuidado con L. Suponga que la eliminación resta el renglón 1 del ren¬ 
glón 2, creando Í 2X = 1. Luego suponga que intercambia los renglones 2 y 3. Si este inter¬ 
cambio se realiza de antemano, el multiplicador cambia a í 3l = 1 en PA = LU. 


1 1 1 

1 1 3 

2 5 8 


1 1 1 
0 0 2 
0 3 6 


Ese intercambio de renglones recupera LU, pero no 


'l 

0 

0' 

'1 

0 

0‘ 

P = 0 

0 

1 

y L = 2 

1 

0 

0 

1 

0 

_1 

0 

1 


1 1 1 

0 3 6 = U. 

0 0 2 


PA = LU. 


En MATLAB , A([r k],:) intercambia el renglón k con el renglón r abajo del renglón 
k (donde se ha encontrado el Pésimo pivote). Las matrices L y P se actualizan de la mis¬ 
ma manera. Al principio, P = / y signo = +1: 

A«r k], : ) = A([k r], : ); 

L([r k],l:k—1) = L([k r],l:k-l); 

P« r k], : ) = P([k rj, : ); 

sign = -sign 

El “signo” de P indica si el número de intercambios de renglones es par (signo = +1) o 
impar (signo = — 1). Un intercambio de renglones invierte el signo. El valor final del sig¬ 
no es el determinante de P y no depende del orden de los intercambios de renglones. 

En resumen: Un buen código de eliminación ahorra L y U y P. Estas matrices contie¬ 
nen la información que originalmente estaba en A, y la contienen en una forma más utiliza- 
ble. Ax = b se reduce a dos sistemas triangulares. Este es el equivalente práctico del cálculo 
que se presenta a continuación: encontrar la matriz inversa A~ l y la solución x = A~'b. 


Conjunto de problemas 1.5 

1. ¿Cuándo es no singular una matriz triangular superior (un conjunto completo de pivo¬ 
tes)? 

2. ¿Qué múltiplo i 32 del renglón 2 de A resta la eliminación del renglón 3 de A? Use la 
forma factorizada 


1 0 0 
2 1 0 
1 4 1 


5 7 8 
0 2 3 
0 0 6 


¿Cuáles son los pivotes? ¿Se requiere un intercambio de renglones? 

3. Multiplique la matriz L = £" 1 F~ I G“ 1 en la ecuación (6) por GFE en la ecuación (3): 


1 

0 

0‘ 

1 

0 

0" 

2 

1 

0 multiplicada por 

-2 

1 

0 

-1 

-1 

1_ 

-1 

1 

1 


También multiplique en orden opuesto. ¿Por qué las respuestas son iguales ? 
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4. Aplique eliminación para obtener los factores L y U de 

f2 ll í 3 1 1_ 

A= y A= 1 3 1 y 

L J 113 


1 1 1 

14 4. 
1 4 8 


5. Factorice A en LU, y escriba el sistema triangular superior Ux — c que aparece después 
de la eliminación, para 

2 3 3 u 2 

Ax = 0 5 7 v = 2 . 

6 9 8 w 5 


6. Encuentre E 2 y E s y E 1 si 


1 0 
ó 1 ‘ 


7. Encuentre los productos FGH y HGF si (donde se han omitido los ceros triangulares 
superiores) 


1 

2 1 
0 0 1 
0 0 0 1 


1 

0 1 
0 2 1 
0 0 0 1 


1 

0 1 
0 0 1 
0 0 2 1 


8. ( Segunda demostración de A = LU) El tercer renglón de U proviene del tercer renglón 
de A al restar múltiplos de los renglones 1 y 2 (\de Ul): 

renglón 3 de U = renglón 3 de A - ¿ 31 (renglón 1 de U) - f 32 (renglón 2 de U). 

a) ¿Por qué se restan renglones de U y no de A? Respuesta: Debido a que en ese mo¬ 
mento se utiliza un renglón pivote_. 

b ) La ecuación anterior es la misma que 

renglón 3 de A = f 31 (renglón 1 de LO — f 32 (renglón 2 de U) + l(renglón 3 de U). 
¿Qué regla de la multiplicación de matrices multiplica por U este renglón 3 de L? 

Los otros renglones de LU coinciden de manera semejante con los renglones de A. 

9. a) ¿En qué condiciones el siguiente producto es no singular? 


1 -1 0 

0 1 -1 

d 3 0 0 1 


tí) Resuelva el sistema Ax = b empezando con Le = tí. 


10 0c, 0 

— 1 1 0 c 2 = 0 = b. 

0-1 lj [ c 3 J |_ 1 _ 

10. a ) ¿Por qué para resolver cada uno de los sistemas Le = b y Ux = c se requieren apro¬ 
ximadamente n 2 / 2 pasos de multiplicación-sustracción? 

tí) ¿Cuántos pasos requiere la eliminación para resolver 10 sistemas con la misma ma¬ 
triz de coeficientes A de 60 por 60? 
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11. Resuelva lo siguiente como dos sistemas triangulares, sin multiplicar LU para encon¬ 
trar A: 

"1 0 0] [2 4 4] [ul [2' 

LUx =110 0 12 v = 0 . 

1 0 lj [O 0 lj [urj |_2_ 

12. ¿Cómo es posible factorizar A en un producto UL, triangular superior multiplicado por 
un sistema triangular inferior? ¿Tendrían los mismos factores que en A — LUI 

13. Resuelva lo siguiente por eliminación, intercambiando renglones cuando sea necesario: 

u + 4i> + 2w = —2 u + w = 0 

—2 u — 8u + 3ti> =32 y u + v =0 
v + w — 1 u + v + w — 1. 

¿Qué matrices de permutación se requieren? 

14 . Escriba todas las matrices de permutación de 3 por 3, incluyendo P = I. Identifique 
sus inversas, que también son matrices de permutación. Las inversas satisfacen 
PP~ l = I, y están en la misma lista. 

15 . Encuentre (y compruebe) las factorizaciones PA = LDU para 


“0 

1 

r 

'1 

2 

r 

A = 1 

0 

i y 

A = 2 

4 

2 

2 

3 

4 

1 

1 

1 


16. Encuentre una matriz de permutación de 4 por 4 que requiera tres intercambios de ren¬ 
glones para llegar al final de la eliminación (que es U = 7). 

17. La forma menos conocida A = LPU intercambia renglones sólo al final: 

"lili [lili [1 0 0] [1 1 f 

A= 1 1 3 -> L~ l A = 0 0 2 = PU = 0 0 1 036. 

2 5 8j [0 3 6J L° 1 °J L° 0 2 - 

¿Cuál es L en este caso? Al comparar con PA = LU en el recuadro 1J, ahora los mul¬ 
tiplicadores permanecen en su sitio (¿ 2 , es 1 y ¿ 31 es 2 cuando A = LPU). 

18. Decida si los siguientes sistemas son singulares o no singulares, y si no tienen solu- 


ción, una solución o una infinidad de soluciones: 


v — w = 2 


o 

II 

3 

1 

s 

V + w = 1 

u — v =2 

y 

u — v =0 

y u + v — 1 

u — ui = 2 


u — w — 0 

u + w = 1 


19. ¿Cuáles números a, b, c conducen a intercambios de renglones? ¿Cuáles hacen singu¬ 
lar a la matriz? 


A = 


1 2 0 
a 8 3 

0 b 5 


y 


A = 


c 2 
6 4 
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En los problemas 20 a 31 se calcula la factorización A = LU (y también A — LDU). 

20. La eliminación hacia adelante cambia [ j * J x — fe a una triangular j j x = c: 


x + y = 5 
x + 2y = 7 


x + y 

y 


1 1 5 

0 12’ 


Ese paso restó ¿ 2 i = _veces el renglón 1 del renglón 2. El paso inverso suma ¿ 2L 

veces el renglón 1 al renglón 2. La matriz para ese paso es L =_. Al multiplicar 

esta L por el sistema triangular [¿ | ] x = [*] se obtiene_=_. En otras 

palabras, L multiplica a Ux = c para obtener_. 

21. (Cambio a 3 por 3) La eliminación hacia adelante cambia Ax = fe a un sistema trian¬ 
gular Ux = c: 

x + y + z = 5 x + y + z = 5 x + y + z = 5 

x + 2y + 3z = 7 y + 2z = 2 y + 2z = 2 

x + 3y + 6z — 11 2y + 5z = 6 z = 2. 

La ecuación z = 2 en Ux = c proviene de la ecuación original x + 3 y + 6z= 11 en 
Ax = fe al restar l 3¡ =_veces la ecuación 1 y ¿ 32 =_veces la ecuación fi¬ 

nal 2. Lo anterior se invierte para recuperar [1 3 6 11] en [A fe] de la [1 1 1 5] fi¬ 
nal y [0 1 2 2] y (0 0 1 2] en [U c]: 

Renglón 3 de [A fe] = (¿ 3¡ renglón 1 + í 32 renglón 2+1 renglón 3) de [17 c]. 

En notación de matrices, esto es una multiplicación por L. Así, A = LU y fe = Le. 

22. ¿Cuáles son los sistemas triangulares de 3 por 3 Le = fe y Ux = c del problema 21? 
Compruebe que c = (5, 2, 2) resuelve el primero. ¿Cuál es el vector x que resuelve el 
segundo? 

23. ¿Cuáles son las dos matrices de eliminación E 2 \ y E 32 que transforman la matriz A en 
la forma triangular superior E 32 E 2l A = {/? Multiplique por E 32 y E 2 ¡ parafactori- 
zar A en LU E 2 \ E 32 U : 

'l 1 f 

A = 2 4 5 . 

0 4 0 

24. ¿Cuáles son las tres matrices de eliminación E 2l , E 3l y E 32 que transforman la matriz 
A en la forma triangular superior E 32 E 3 1 E 2( A = W. Multiplique por E 32 , E 3 ¡ y E 2l l 
para factorizar A en LU, donde L = E 2 ¡ E 3l l E 32 . Encuentre L y U: 

‘i o r 

A = 2 2 2 . 

_3 4 5_ 

25. Cuando en la posición pivote aparece un cero, ¡A = LU no es posible ! (Se requieren 
pivotes diferentes de cero d,f i en U.) Demuestre directamente por qué los dos casos 
siguientes son imposibles: 


26. ¿Qué número c produce un cero en la segunda posición pivote? Se requiere un inter¬ 
cambio de renglones y A = LU no es posible. ¿Qué número c produce un cero en la 


6 i i 7 
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tercera posición pivote? Así, un intercambio de renglones no puede ayudar y la elimi¬ 
nación falla: _ _ 

1 c 0 

A = 2 4 1 . 

_3 5 l 

27. ¿Cuáles son L y D para esta matriz A? ¿Cuál es U en A = LU y cuál es la nueva U en 
A = LDW. 

2 4 8 

A = 0 3 9 . 

0 0 7_ 

28. Ayfi son simétricas a través de la diagonal (porque 4 = 4). Encuentre sus factoriza- 
ciones triples LDU, y escriba cómo está relacionada U con L para estas matrices simé¬ 
tricas: 

r i 14 0 

A= 4 u y s= 4 12 4 . 

|_0 4 0_ 

29 . (Recomendado) Calcule L y U para la matriz simétrica 

a a a a 

a fe fe fe 

A — , 

a b c c 

a fe c d 

Encuentre cuatro condiciones sobre a, fe, c, d para obtener A = LU con cuatro pivotes. 

30. Encuentre L y U para la matriz no simétrica: 

a r r r 

a fe s s 
A = , . • 

a fe c t 

a fe c d 

L -i 

Encuentre cuatro condiciones sobre a, fe, c, d, r, s, t para obtener A = LU con cuatro 
pivotes. 

31. Las matrices tridiagonales tienen elementos iguales a cero, excepto en la diagonal prin¬ 
cipal y en las dos diagonales adyacentes. Factorice lo siguiente en A = LU y A = LDV: 


'1 

1 

0' 

a 

a 

0 

1 

2 

i y 

A = a 

a + fe 

fe 

0 

1 

2 

_0 

fe 

fe + c 


32. Resuelva el sistema triangular Le = fe para encontrar c. Luego, resuelva Ux = c para 
encontrar x: 

n oí f2 4 i , r 2 

¿=[ 4 ij y t/ = [ 0 ij y *=[iil 

Por seguridad, encuentre A = LU y resuelva Ax — fe como de costumbre. Identifique 
c cuando lo vea. 

33. Resuelva Le — b para encontrar c. Luego resuelva Ux = c para encontrar x. ¿Cuál era 
la matriz A? 


1 0 0 
1 1 0 
1 1 1 


1 1 1 
0 1 1 
0 0 1 
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34. Si A y B tienen elementos distintos de cero en las posiciones indicadas con x, ¿qué ce¬ 
ros siguen siendo ceros en sus factores L y U7 


35. (Importante) Si A tiene pivotes 2, 7, 6 sin intercambios de renglones, ¿cuáles son los 
pivotes para la parte superior izquierda de la submatriz B de 2 por 2 (sin el renglón 3 
y la columna 3)? Explique su respuesta. 


36. Empezando con una matriz A de 3 por 3 con pivotes 2, 7, 6, añada un cuarto renglón 
y una cuarta columna para obtener M. ¿Cuáles son los tres primeros pivotes de M, y 
por qué? ¿Cuáles son el cuarto renglón y la cuarta columna que aseguran la obtención 
de un 9 en el cuarto pivote? 


37. Use chol(pascal(5)) para encontrar los factores triangulares de pascal(5) de MATLAB. 
¡Intercambios de renglones en [L, Lf¡ = lu(pascal(5» arruinan el patrón de Pascal! 

38. (Repaso) ¿Para qué números c es imposible A = LU con tres pivotes? 


A = 


1 2 
3 c 


0 1 



39. Calcule la diferencia temporal para cada nuevo miembro derecho b cuando n — 800. 
Establezca A = rand(800), b = rand(800,l) y B = rand(800,9). Compare los tiem¬ 
pos de tic; A\b; toe y tic A\B; toe (que resuelve para 9 miembros derechos). 


Los problemas 40 a 48 son sobre matrices de permutación. 

40. Hay 12 permutaciones “pares" de (1, 2, 3, 4) con un número par de intercambios. Dos 
de éstas son (1, 2, 3, 4) sin intercambios y (4, 3, 2, 1) con dos intercambios. Enumere 
los otros 10. En vez de escribir cada matriz de 4 por 4, use los números 4, 3, 2, 1 pa¬ 
ra proporcionar la posición del 1 en cada renglón. 

41. ¿Con cuántos intercambios se permuta (5, 4, 3, 2,1) de vuelta a (1,2, 3,4, 5)? ¿Cuán¬ 
tos intercambios son necesarios para ir de (6, 5, 4, 3, 2, 1) a (1, 2, 3, 4, 5, 6)? Uno es 
par y el otro es impar. Para ir de (n, .... 1) a (1, ... , n ), demuestre que n = 100 y 
101 son pares, y que n = 102 y 103 son impares. 

42. Si P [ y P 2 son matrices de permutación, también lo es P X P 2 - Esta última matriz sigue 
teniendo los renglones de I en algún orden. Proporcione ejemplos con P X P 2 ^ P 2 P\ y 
P3P4 = P 4 P 3 - 

43. (Intente responder esta pregunta). ¿Cuál es la permutación que hace triangular supe¬ 
rior a PA'7 ¿Cuál es la permutación que hace triangular inferior a P x AP 2 ? Al multipli¬ 
car A por la derecha por P 2 se intercambia el __ de A. 

'0 0 6 

A = 12 3. 

0 4 5 

44. Encuentre una matriz de permutación de 3 por 3 con P 3 = I (pero no P = I). Encuen¬ 
tre una permutación de 4 por 4 p con p 4 ^ / . 
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45. Si se toman potencias de una permutación, ¿por qué alguna P* termina siendo igual a 
/? Encuentre una permutación de 5 por 5 P de modo que la menor potencia que es 
igual a I es P 6 . (Éste es un problema de desafío. Combine un bloque de 2 por 2 con un 
bloque de 3 por 3.) 

46. La matriz P que multiplica a (x, y, z ) para obtener (z, x, y) también es una matriz de 
rotación. Encuentre P y P 3 . El eje de rotación a = (1, 1, 1) no se mueve, y es igual a 
Pa. ¿Cuál es el ángulo de rotación de v = (2, 3, —5) a Pv = (—5, 2, 3)7 

47. Si P es cualquier matriz de permutación, encuentre un vector x diferente de cero de 
modo que (/ - P)x = 0. (Esto significa que I - P no tiene inversa, y que su determi¬ 
nante es cero). 

48. Si P tiene ls en su antidiagonal desde (1, ri) hasta ( n , 1), describa PAP. 


1.6 INVERSAS Y TRASPUESTAS 

La inversa de una matriz de n por n es otra matriz de n por n. La inversa de A se denota por 
A “ 1 (lo cual se lee “A inversa”). La propiedad fundamental es sencilla: Si se multiplica por 
A y luego se multiplica por A -1 , se regresa a la posición inicial. 

Matriz inversa Si b — Ax, entonces A l b = x. 

Así, A -1 Ax = x. La matriz A" 1 multiplicada por la matriz A es la matriz identidad. No to¬ 
das las matrices tienen inversas. Una inversa es imposible cuando Ax es cero y x es di¬ 
ferente de cero. Por tanto, A~ 1 debería tener que regresar de Ax = 0 a x. Ninguna matriz 
puede multiplicar ese vector cero Ax y producir un vector x diferente de cero. 

Los objetivos son definir la matriz inversa, calcularla y aplicarla, cuando A 1 existe, 
y luego comprender cuáles matrices no tienen inversas. 


1K La inversa de A es una matriz 
una B, y ésta se denota por A ~ 1 : 



ue BA = I y AB = /. 


Nota 1 La inversa existe si y sólo si la eliminación produce n pivotes (se permiten inter¬ 
cambios de renglones). La eliminación resuelve Ax = b sin encontrar explícitamente A -1 . 

Nota 2 La matriz A no puede tener dos inversas distintas. Suponga que BA = / y también 
que AC = I. Entonces B = C, según la siguiente “demostración por paréntesis”: 

B{AC) = ( BA)C proporciona BI = IC, que es B = C. (2) 

Esto demuestra que una inversa izquierda B (que multiplica por la izquierda) y una inver¬ 
sa derecha C (que multiplica a A por la derecha para obtener AC = 1 ) deben ser la misma 
matriz. 

Nota 3 Si A es invertible, la sola y única solución de Ax = ¿ es x = A ~ ! h: 

SiAx — b se multiplica por A -1 , entonces x = A~ l Ax —A 1 b. 

Nota 4 (Importante) Suponga que hay un vector x diferente de cero tal que Ax — 0. En¬ 
tonces A no puede tener inversa. Para repetir: Ninguna matriz es capaz de regresar el 0 a x. 
Si A es invertible, entonces Ax = 0 sólo puede tener la solución x = 0. 
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Nota 5 Una matriz de 2 por 2 es invertible si y sólo si ad - be es diferente de cero: 

r , „ . ¡a b]~~ l 1 r d —b 

Inversa de 2 por 2 , = —-- . (3) 

[ c d \ ad - be [—e a¡ K ’ 

El número ad - be es el determinante de A. Una matriz es invertible si su determinante es 
distinto de cero (véase el capítulo 4). En MATLAB, la prueba de invertibilidad consiste en 
encontrar n pivotes diferentes de cero. La eliminación produce estos pivotes antes de que 
aparezca el determinante. 

Nota 6 Una matriz diagonal tiene una inversa en el supuesto de que ninguno de los ele¬ 
mentos diagonales es cero: 


Si A = 

di 


entonces A 1 = 

'1 /di 




d _ 



1/4.. 


Cuando están implicadas dos matrices, no hay mucho que hacer sobre la inversa de 
A + B. La suma puede o no ser invertible. En vez de lo anterior, la fórmula clave en cálcu¬ 
los matriciales es la inversa de su producto, AB. Los números normales son los mismos: 
(a + b)~ 1 es difícil de simplificar, mientras 1 lab se separa en Ha veces 1 Ib. Sin embargo, 
para matrices el orden de la multiplicación debe ser correcto: si ABx = y, entonces Bx = 
A~ l y y x = B~ 1 A~ 1 y. Las inversas se presentan en orden opuesto. 

1L Un producto AB de matrices invertibles es invertido por B~ l A~ l : 

Inversa de AB (AB)~ l = B~ l A~ l . (4) 

Demostración Para demostrar que B^A" 1 es la inversa de AB, las matrices se multipli¬ 
can y se aplica la ley asociativa para quitar los paréntesis. Observe que B se escribe al la¬ 
do de B _1 : 

(AB)(B~~ l A~ l ) =ABB- l A~ l = A/A~‘ = AA~* = / 

(B~ l A~ l )(AB) = B~'A~ l AB = B~ l IB = B~‘B = I. M 

Una regla semejante se cumple para tres o más matrices: 

Inversa de ABC (ABC)~ l = C~ 1 B~ l A~ 1 . 

Este cambio de orden se vio cuando las matrices de eliminación E, F, y G se invirtieron pa¬ 
ra regresar de U a A. En la dirección hacia adelante, GFEA era U. En la dirección hacia 
atrás, L = E~ l F l G~~ l era el producto de las inversas. Debido a que al último aparece G, 
entonces G -1 aparece primero. Por favor compruebe que A' 1 sería U~ l GFE. 

Cálculo de 4 -1 : El método de Gauss-Jordan 

Considere la ecuación AA~ 1 = I. Si se toma una columna a la vez, la ecuación determina 
cada columna de A~ 1 . La primera columna de A~ 1 se multiplica por A, para producir la pri¬ 
mera columna de la identidad: Ax¡ = e¡. De manera semejante, Ax 2 = e 2 y Ax 3 = <?-; las 
es son las columnas de /. En un ejemplo de 3 por 3, A multiplicada por A -1 es /: 

[l 0 0' 

e\ e 2 e 3 = 0 1 0 . (5) 

[0 0 1 


2 1 l] r 

Ax¡ = e¡ 4 —6 0 x\ x 2 x 3 

—2 1 2 ] [ 
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Ejemplo t 


Así, se tienen tres sistemas de ecuaciones (o n sistemas). Todos tienen la misma matriz de 
coeficientes A. Los miembros derechos e u e 2 , e 3 , son diferentes, aunque la eliminación es 
posible en todos los sistemas de manera simultánea. Este es el método de Gauss-Jordan. 
En vez de detenerse en U y cambiar a sustitución hacia atrás, continúa restando múltiplos 
de un renglón de los renglones de arriba. Esto produce ceros araba de la diagonal, y tam¬ 
bién abajo de ésta. Cuando llega a la matriz identidad, se ha encontrado A -1 . 

El siguiente ejemplo preserva todas las tres columnas e h e 2 , e 3 , y opera sobre renglo¬ 
nes de longitud igual a seis: 

Aplicar el método de Gauss-Jordan para encontrar A -1 

'211100' 

[A e t e 2 e 3 J = 4 —6 0 0 1 0 

[-2 7 2 0 0 1_ 

'211100' 

Pivote = 2 —y 0 —8 —2 —2 1 0 

0 8 3 1 0 1 

'211100] 

Pivote = —8 —> 0 —8 —2 —2 1 0 = \V L _1 ] • 

0 0 1 -1 1 lj 

Esto completa la eliminación hacia adelante, de la primera mitad. La triangular superior 
U aparece en las tres primeras columnas. Las otras tres columnas son las mismas que en 
L _I . (Éste es el efecto de aplicar las operaciones elementales GFE a la matriz identidad). 
Luego, la segunda mitad regresa de U a / (al multiplicar por U~ l ). Esto lleva L 1 a 
U~ l L~ l , que es A -1 . Creando ceros arriba de los pivotes se llega a A -1 : 

'2102-1 -1' 

Segunda mitad \JJ L -1 ] —*■ 0 —8 0 —4 3 2 

0 0 1—1 1 1_ 


ceros arriba de los pivotes 


se divide entre los pivotes 


'2 0 0 f -| -f 

0-80-4 32 

0 0 1-1 1 1 _ 



En el último paso, los renglones se dividieron entre sus pivotes 2 y -8 y 1. La matriz de 
coeficientes en el miembro izquierdo se transformó en la identidad. Debido a que A se con¬ 
virtió en I, las mismas operaciones en el miembro derecho deben llevar / a A 1 . En conse¬ 
cuencia, se ha calculado la inversa. 

Una nota para el futuro: El lector puede ver el determinante -16 que aparece en los de¬ 
nominadores de A -1 . El determinante es el producto de ios pivotes (2)(—8)(1). Entra al 
final cuando los renglones se dividen entre los pivotes. 
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Observación 1 A pesar de este brillante éxito al calcular A *, no lo recomiendo. Admito 
que A 1 resuelve en un paso Ax = b. Dos pasos triangulares son mejores: 

x = A~ l b se separa en Le = b y Ux = c. 

Puede escribirse c = L l b y luego x = U~ 1 c = U~ 1 L~ 1 b. Sin embargo, observe que es¬ 
tas matrices L 1 y U~ l no se formaron de manera explícita, y en el cálculo verdadero, no 
deben formarse. Hacerlo sería una pérdida de tiempo, ya que sólo se requiere sustitución 
hacia atrás para x (y la sustitución hacia adelante produjo c ). 

Una observación semejante es válida para A -1 ; la multiplicación A~ l b seguiría requi¬ 
riendo n 2 pasos. Lo que se busca es la solución, no todos los elementos de la inversa. 

Observación 2 Sólo por curiosidad, podría contarse el número de operaciones necesa¬ 
rias para encontrar A l . La cuenta normal para cada nuevo miembro derecho es n 2 , la mi¬ 
tad en la dirección hacia adelante y la mitad en la sustitución hacia atrás. Con n miembros 
derechos e¡, . . . , e„ esto hace n 3 . Luego de incluir las n 3 / 3 operaciones sobre A misma, 
parece que el total es 4n 3 /3. 


Este resultado es ligeramente elevado debido a los ceros en los e¡. La eliminación ha¬ 
cia adelante cambia sólo los ceros que están debajo del 1. Esta parte sólo tiene n — j compo¬ 
nentes, de modo que la cuenta para las e¡ cambia efectivamente a (n -j) 2 !2. Al sumar sobre 
todas las y, el total para la eliminación hacia adelante es n 3 / 6 . Esto debe combinarse con las 
rc 3 /3 operaciones de costumbre que se aplican a A, y los n(n 2 / 2) pasos de la sustitución ha¬ 
cia atrás que finalmente producen las columnas x¡ de A -1 . La cuenta final de multiplicacio¬ 
nes para calcular A 1 es n 3 : 


Conteo de operaciones 



Este conteo es extraordinariamente bajo. Debido a que la multiplicación de matrices 
consume n 3 pasos, ¡requiere tantas operaciones para calcular A 2 como las necesarias para 
calcular A 1 ! Este hecho parece casi increíble (y calcular A 3 requiere el doble, hasta don¬ 
de puede verse). A pesar de lo anterior, si A -1 no es necesaria, no debe calcularse. 

Observación 3 En el cálculo de Gauss-Jordán, siempre se fue en busca de U, antes de ini¬ 
ciar el procedimiento hacia atrás para obtener ceros aniba de los pivotes. Esto es como la 
eliminación gaussiana, aunque también son posibles otros órdenes. Hubiera podido utilizar¬ 
se el segundo pivote cuando se estaba ahí antes, con la finalidad de obtener un cero arriba 
del pivote, así como también abajo de él. Esto no es inteligente. En ese instante el segundo 
renglón está virtualmente lleno, mientras cerca del extremo tiene ceros provenientes de las 
operaciones en renglones hacia arriba que ya se habían realizado. 


Invertible = No singular (n pivotes) 

En última instancia, lo que se quiere saber es cuáles matrices son invertibles y cuáles no lo 
son. Esta cuestión es tan importante que tiene muchas respuestas. \Consulte la última pá¬ 
gina del librol 

En cada uno de los cinco primeros capítulos se proporciona una prueba diferente 
(aunque equivalente) para comprobar la invertibilidad. Algunas veces las pruebas se ex¬ 
tienden a matrices rectangulares e inversas por un lado: el capítulo 2 investiga el tema de 
renglones y columnas independientes. En el capítulo 3 se invierte AA T o A T A. En los otros 
capítulos se abordan los determinantes diferentes de cero , los valores característicos di¬ 
ferentes de cero o los pivotes diferentes de cero. Esta última prueba es la que se encuen¬ 
tra en la eliminación gaussiana. Se quiere demostrar (en unos cuantos párrafos teóricos) 
que la prueba de los pivotes es exitosa. 
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Suponga que A cuenta con un conjunto completo de pivotes. AA'~ 1 = I proporciona n 
sistemas Ax¡ = e¡ por separado para las columnas de A -1 . Estos sistemas pueden resolver¬ 
se por eliminación o por Gauss-Jordan. Pueden requerirse intercambios de renglones, pero 
las columnas de A -1 están determinadas. 

Hablando estrictamente, es necesario demostrar que la matriz A -1 con esas columnas 
también es autoinversa. Al resolver AA~ 1 = / se resuelve al mismo tiempo A~ 'A = I, pero, 
¿por qué? Una inversa por un lado de una matriz cuadrada, es automáticamente una 
inversa por dos lados. Para ver por qué, observe que todo paso de Gauss-Jordan es una 
multiplicación por la izquierda por una matriz elemental. Se están permitiendo tres tipos de 
matrices elementales: 

1. Ei¡ para restar un múltiplo l del renglón j del renglón i. 

2. Py para intercambiar los renglones i y j. 

3. D (o D~ l ) para dividir todos los renglones entre sus pivotes. 

El proceso de Gauss-Jordan en realidad es una secuencia gigantesca de multiplicaciones de 
matrices: 

(D-‘ P ■■ ■ E)A = /. (6) 

La matriz entre paréntesis, a la izquierda de A, ¡evidentemente es una autoinversa! Por la 
nota 2, existe, y es igual a la inversa derecha, de modo que toda matriz no singular es in¬ 
vertible. 

La conversa también es verdadera: Si A es invertible, tiene n pivotes. En un caso ex¬ 
tremo que es claro: A no puede tener toda una columna de ceros. La inversa jamás podría 
multiplicar una columna de ceros para producir una columna de I. En un caso menos ex¬ 
tremo, suponga que la eliminación inicia en una matriz invertible A, pero que falla en la co¬ 
lumna 3: 

di x x x 

Falla A , _ 0 d 2 x x 

En la columna 3 no hay pivote 0 0 0 x ' 

0 0 0 x 

Esta matriz no puede tener una inversa, sin importar cuáles sean las x. Una demostración de 
este hecho es aplicar operaciones en las columnas (¿por primera vez?) con la finalidad 
de hacer cero toda la columna. Al restar múltiplos de la columna 2 y luego de la columna 1, 
se llega a una matriz que ciertamente no es invertible. En consecuencia, la matriz original A 
no es invertible. La eliminación proporciona una prueba completa: Una matriz de nporn es 
invertible si y sólo si tiene n pivotes. 

La matriz traspuesta 

Se requiere una matriz más, y por fortuna es mucho más sencilla que la inversa. La tras¬ 
puesta de A se denota por A T . Sus columnas se toman directamente de los renglones de A: 
el i-ésimo renglón de A se convierte en la i-ésima columna de A T : 

f2 , i"2 o 

Traspuesta Si A = _ „ „ entonces A T = 1 0 

L° 0 3 J [4 3 

Al mismo tiempo, las columnas de A se convierten en los renglones de A 1 . Si A es una ma¬ 
triz de m por n, entonces A T es de n por m. El efecto final es doblar la matriz respecto a su 
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diagonal principal, y el elemento en el renglón i, columna j de A T proviene del elemento 
que está en el renglón j, columna i de A: 

Elementos de A x (A T ) íy - = Aj¡. (7) 

La traspuesta de una matriz triangular inferior es triangular superior. La traspuesta de A T 
lleva de regreso a A. 

Si se suman dos matrices y luego se traspone, el resultado es el mismo que si prime¬ 
ro se traspone y luego se suma: (A + B) T es lo mismo que A T + B T . Pero, ¿a qué es igual 
la traspuesta de un producto AB o de una inversa A -1 ? A continuación se presentan las 
fórmulas esenciales de esta sección: 

1M i) La traspuesta de AB es (AB) 1 = B 1 A 7 
ii) La traspuesta de A -1 es (A -1 ) T = (A T )~‘. 

Observe el parecido de la fórmula para (AB) 7 con el resultado de la fórmula para (AB) -1 . 
En ambos casos se invierte el orden, con lo que se obtiene B T A T y B -1 A -1 . La demostra¬ 
ción para la inversa fue fácil, pero ésta requiere de una paciencia extraordinaria con la mul¬ 
tiplicación de matrices. El primer renglón de (AB) T es la primera columna de AB. Así, las 
columnas de A están ponderadas por la primera columna de B. Esto se suma a los renglo¬ 
nes de A t ponderados por el primer renglón de B T . Eso es exactamente el primer renglón 
de B t A t . Los otros renglones de (AB) T y B T A T también coinciden. 


B T 

Con la finalidad de establecer la fórmula para (A"‘) T , se inicia con AA~’ = / y A~ l A = I, 
y se toman las traspuestas. En un miembro, / T = I. En el otro miembro, por el inciso i) se 
conoce la traspuesta de un producto. Puede verse cómo (A~ ‘) T es la inversa de A T , lo cual 
demuestra ii): 

Inversa de A r ~ Traspuesta de A -1 (A"’) T A T = I. (8) 

Matrices simétricas 

Una vez que se han establecido estas reglas, es posible presentar una clase especial de ma¬ 
trices; quizá la clase más importante de todas. Una matriz simétrica es una matriz que es 
igual a su propia traspuesta: A 7 — A. La matriz es necesariamente cuadrada. Cada ele¬ 
mento en un miembro de la diagonal es igual a su “imagen especular” en el otro lado: 
ay = aj¡. Dos ejemplos sencillos son A y D (y también A -1 ): 

12 ] ri oí i r b —2 

Matrices simétricas A=. 0 y D — y A -1 = - 

¿ o U 4 4 —2 1 

Una matriz simétrica no necesariamente es invertible; incluso, puede ser una matriz de ce¬ 
ros. Pero si A~ l existe, también es simétrica. Con base en la fórmula ii) anterior, la tras¬ 
puesta de A -1 siempre es igual a (A r )~ 1 ; para una matriz simétrica lo anterior es justo A -l . 
A -t es igual a su propia traspuesta; es simétrica siempre que A lo sea. Ahora se ha demos¬ 
trado que el resultado de multiplicar cualquier matriz R por R r es una matriz simétrica. 


Se empieza con 
Traspuesta de 
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Productos simétricos R T R, fí fí r , y LDL T 

Sea cualquier matriz R, quizá rectangular. Multiplique R 1 por R. Entonces el producto R 7 R 
es automáticamente una matriz simétrica cuadrada: 

La traspuesta de R r R es R T (R 7 ) 7 , que es R r R. (9) 

Esta es una demostración rápida de simetría para R r R. Su elemento i, j es el producto in¬ 
terno del renglón i de R 7 (columna i de R) con la columna j de R. El elemento (j, i) es el 
mismo producto intemo, la columna j con la columna i. Así, R T R es simétrica. 

RR 1 también es simétrica, aunque diferente de R r R. En mi experiencia, la mayor par¬ 
te de los problemas científicos que empiezan con una matriz rectangular R terminan con 
R r R, con RR 1 o con ambas. 


Ejemplo 2 


[1 2 ] 


producen R 7 R 


El producto R r R es de n por n. En orden opuesto, R R r es de m por m. Incluso si m = n, 
no es muy probable que R T R = R R 1 . La igualdad puede ocurrir, aunque no es normal. 

Las matrices simétricas se presentan en todo tema cuyas leyes son justas. “Cada 
acción tiene una reacción igual y opuesta.” El elemento ay que proporciona la acción de i 
sobre j es compensado por aj¡. Esta simetría se verá en la siguiente sección, para ecuacio¬ 
nes diferenciales. Aquí LU pierde la simetría, pero LDL r la captura perfectamente. 


1N Suponga que A = A T pued 
glones. Entonces U es la trasp 
A = LDL?. 


rse en A = 


n intercaml 


resta de L. La faetoriiación simétrica se vuelve 


La traspuesta de A = LDU proporciona A T = U T D T L T . Debido a que A = A T , ahora se tie¬ 
nen dos factorizaciones de A en triangular inferior multiplicada por triangular superior (L T 
es triangular superior con Is en la diagonal, exactamente como U.) Debido a que la facto- 
rización es única (consulte el problema 17), L 7 debe ser idéntica a U. 


L 7 = U y A = LDL 7 


1 0 ] [1 01 11 2 


2 1 0 4 0 1 


Cuando se aplica eliminación a una matriz simétrica, A T = A es una ventaja. Las matrices 
más pequeñas siguen siendo simétricas a medida que procede la eliminación, de modo que 
¡Es posible trabajar con la mitad de la matriz! El ángulo inferior del miembro derecho si¬ 
gue siendo simétrico: 


abe 
b d e 
c e f 


El trabajo de la eliminación se reduce de r?i 3 a n 3 / 6. No es necesario almacenar los ele¬ 
mentos de ambos lados de la diagonal, o de almacenar tanto a L como a U. 
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Conjunto de problemas 1.6 

1. Encuentre las inversas (no se requiere ningún sistema especial) de 


0 2 
3 0 ’ 


2 0 
4 2 ’ 


eos 9 —sen 9 
sen 9 eos 0 


2. a) Encuentre las inversas de las matrices de permutación 


"0 

0 

f 

"0 

0 

f 

P = 0 

1 

0 y 

p = 1 

0 

0 

1 

0 

0 

0 

1 

0 


b) Explique para permutaciones, por qué P 1 siempre es igual a P r . Demuestre que los 
ls están en los sitios correctos para obtener PP r = I. 

3. A partir de AB = C, encuentre una fórmula para A” 1 . También encuentre A -1 a partir 
de PA = LU. 


4. a) Si A es invertible y AB = AC , demuestre rápidamente que B = C. 
b) Si A = |^¿ § j, encuentre un ejemplo con AB = AC, pero B ¥> C. 

5. Si la inversa de A 2 es B, demuestre que la inversa de A es AB. (Por tanto, A es invertí- 
ble siempre que A 2 es invertible.) 

6 . Aplique el método de Gauss-Jordan para invertir las siguientes matrices 


'1 

0 

01 

1 

1 

II 

es 

0 

0 

1J 


2 

-1 

0' 

ro 

0 

1 

1 

2 

- 1 

0 

II 

1 

1 

0 

-1 

2 

L 1 

1 

1 


7. Encuentre tres matrices de 2 por 2, que no sean A = / y A = —/, que sean sus propias 
inversas: A 2 = I. 

8 . Demuestre que A = |" 3 3 ] no tiene inversa, resolviendo Ax — 0, y fallando al resolver 


11 a b 
3 3 c d 


9. Suponga que la eliminación fracasa porque en la columna 3 no hay pivote: 


Pivote fallante A 


2 14 6 

0 3 8 5 

0 0 0 7’ 

0 0 0 9 


Demuestre que A no puede ser invertible. El tercer renglón de A *, multiplicado por A, 
debe proporcionar el tercer renglón [0 0 1 0] de A~ l A = I. ¿Por qué es imposible esto? 


10. Encuentre las inversas (de cualquier manera permitida) de 


o 

0 

0 

ii 

1 

0 

0 

0 

0 

2 

0 

_ i 

1 

0 

0 

3 

0 

0 - Az_ 

2 

0 

2 

3 

1 

4 

0 

0 

0 _ 

0 

0 

3 

4 


a b 0 0 
c d 0 0 
0 0 a b 
0 0 c d 


sí? SKWSS»*? 
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11. Proporcione ejemplos deCA y-.-R tales-que ;¡ch ahgumtína 

a) A + B no es invertible, aunque A y B sí lo son. 

b) A + B es invertible, aunque A y B no lo son. 

c) Las tres A, B, y A + B son invertibles. 

En el último caso su A~ l (A + B)B~ l = B~ l + A~ l para demostrar que 
C — B~ l + A~ l también es invertible y encuentre una fórmula para C -1 . 

12. Si A es invertible, ¿qué propiedades de A siguen siendo verdaderas para A~ l ? 

a ) A es triangular. b) A es simétrica. c) A es tridiagonal. 

d) Todos los elementos de A son números enteros. 

e) Todos los elementos de A son fracciones (incluso los números como f ). 

13. Si A = [j] y B = [ 2 ], calcule A T B, B T A, AB T y BA r . 

14. Si B es cuadrada, demuestre que A = B + B r siempre es simétrica, y K = B - B T siem¬ 

pre es simétrica sesgada, lo cual significa que K T = —K. Encuentre estas matrices A 
y K cuando B — [{ j], y escriba B como la suma de una matriz simétrica y una ma¬ 

triz simétrica sesgada. 

15. a) ¿Cuántos elementos pueden elegirse independientemente en una matriz simétrica 

de orden ni 

b ) ¿Cuántos elementos pueden elegirse independientemente en una matriz simétrica 
sesgada {K T = — K) de orden ni ¡La diagonal de K es cero! 

16. a) Si A = LDU, con ls en la diagonal de L y U, ¿cuál es la factorización correspon¬ 

diente de A t ? Observe que A y A T (matrices cuadradas sin intercambios de renglo¬ 
nes) comparten los mismos pivotes. 
b) ¿Con qué sistemas triangulares se obtiene la solución de A r y = bl 

17. Si A = L l D ¡ U l y A — demuestre que L x = L- ¿ , D¡ = D 2 y = U 2 , Si A es 

invertible, la factorización es única. 

a ) Deduzca la ecuación L 2 D 2 = DiUiU 2 \ y explique por qué un miembro es 
triangular inferior y el otro es triangular superior. 

b) Compare las diagonales principales, y luego compare el resto de las matrices. 

18. ¿Cuáles son las condiciones sobre los elementos de A y B para que éstas sean in¬ 
vertibles? 


a 

b 

c 

a 

b 

0' 

d 

e 

0 

B — c 

d 

0 

f 

0 

0 

0 

0 

e 


19. Compruebe la factorización simétrica LDL r de 
'1 3 5 

A = 3 12 18 y 


12 18 
18 30 


20. Encuentre la inversa de 


A 0 0 0" 

I 1 0 0 

3 3 1 0 ' 

''Lili 
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21. (Extraordinario) Si A y B son matrices cuadradas, demuestre que I - BA es invertible 
si I - AB es invertible. Empiece con B(I - AB) = (/ - BA)B. 

22. Encuentre las inversas (directamente o a partir de la fórmula de 2 por 2) de A, B, C: 

fO 3l _ \a b] _ [3 4 

A 46 y B ¿o y c 57' 


23. Resuelva para las columnas de A 1 


10 20 x 
20 50 y 


10 20] [Y 

20 50 z 


*12" 

Demuestre que 3 6 no tiene inversa tratando de resolver para la columna (x, y): 


12 x í 
3 6 y z 


debe incluir 


1 2 x 

3 6 y 


25. (Importante) Si A es tal que renglón 1 + renglón 2 = renglón 3, demuestre que A no 
es invertible: 

a) Explique por qué Ax = (1, 0, 0) no puede tener una solución. 

b) ¿Qué miembros derechos (¿> lr b 2 , fc 3 ) pueden permitir una solución a Ax — bl 

c) ¿Qué ocurre al renglón 3 en la eliminación? 

26. Si A es tal que columna 1 + columna 2 = columna 3, demuestre que A no es in vertible: 
á) Encuentre una solución x diferente de cero de Ax — 0. La matriz es de 3 por 3. 

b ) La eliminación preserva columna 1 + columna 2 = columna 3. Explique por qué 
no hay un tercer pivote. 

27. Suponga que A es invertible y que sus dos primeros renglones se intercambian para ob¬ 
tener B. La nueva matriz B, ¿es invertible? ¿Cómo puede obtenerse B~ 1 a partir de A~ l ? 

28. Si el producto M = ABC de tres matrices cuadradas es invertible, entonces A, B, C son 
invertibles. Encuentre una fórmula para R -1 que implique a M~ 1 , A y C. 

29. Demuestre que una matriz con una columna de ceros no puede tener una inversa. 

30. Multiplique [“ b d \ por [_* “*]. ¿Cuál es la inversa de cada matriz si ad # bel 

31. á) ¿Qué matriz E tiene el mismo efecto que los siguientes tres pasos? Reste el renglón 

1 del renglón 2, reste el renglón 1 del renglón 3, y luego reste el renglón 2 del ren¬ 
glón 3. 

b) ¿Qué simple matriz L tiene el mismo efecto que los siguientes tres pasos inversos? 
Sume el renglón 2 al renglón 3, sume el renglón 1 al renglón 3, y luego sume el ren¬ 
glón 1 al renglón 2. 

32. Encuentre los números ay b con los que se obtiene la inversa de 5*eye(4) ones(4, 4): 

4 — 1 — 1 — 1 1 a b b b 

-1 4-1-1 _ b a b b 

-1—1 4-1 b b a b 

—1-1-1 4 b b b a 


¿Cuáles son a y b en la inversa de 6*eye(5) ones(5, 5)? 


son invertibles? 


Los problemas 35 a 39 son sobre el método de Gauss-Jordán para calcular A '. 

35. Transforme I en A ~ 1 a medida que reduce A a / (por medio de operaciones en los ren¬ 
glones): 

r . rl _ fl 3 1 0] r 4 _ [1 4 1 0' 

i A r ] [2 7 0 lj y ^ [3 9 0 1 ' 

36. Imite el ejemplo de 3 por 3 del texto, pero con un signo + en A. Elimine por arriba y 
por abajo de los pivotes para reducir [A /] a [/ A -1 ]: 

' 210100 ' 

[A /] = 1 2 1 0 1 0 . 

[0 1 2 0 0 1 

37. Aplique eliminación de Gauss-Jordán sobre [A /] para resolver AA -1 = /: 


lab 
0 1 c 
0 0 1 


Xi x 2 x 3 


1 0 0 

0 10. 
0 0 1 


38. Invierta las siguientes matrices por eliminación de Gauss-Jordan, empezando con [A /]: 


'1 

0 

0 ' 

"1 

1 

1 " 

A = 2 

1 

3 

y A = 1 

2 

2 

0 

0 

1 

1 

2 

3 


39. Intercambie renglones, y prosiga con eliminación de Gauss-Jordan para encontrar 
A -1 : 


r A /i = r° 2 1 °1 

L A Y [220 1/ 


40. ¿Falso o verdadero? (proporcione un contraejemplo si es falso y una explicación si es 
verdadero): 

a) Una matriz de 4 por 4 con un renglón de ceros no es invertible. 

b) Una matriz con Is abajo de la diagonal principal es invertible. 

c) Si A es invertible, entonces A -1 es invertible. 

d ) Si A t es invertible, entonces A es invertible. 

41. ¿Para cuáles tres números c la siguiente matriz, no es invertible? ¿Por qué? 

[2 c el 


c c c . 

8 7 c 


42. Demuestre que A es invertible sia^Oya^b (encuentre los pivotes y A l ): 


a b b 
a a b 
a a a 
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43. La inversa de la siguiente matriz es extraordinaria. Encuéntrela por eliminación sobre 
[A ¿]. Extienda lo anterior a una “matriz alternante” de 5 por 5, y conjeture su inversa: 


44. Si B tiene las columnas de A en orden invertido, resuelva (A - B)x — 0 para demostrar 
que A - B no es invertible. Un ejemplo lo conducirá a x. 

45. Encuentre y compruebe las inversas (suponiendo que existen) de las siguientes matri¬ 
ces en bloque: 


46. Use inv(S) para invertir la matriz simétrica MATLAB de 4 por 4 S = pascai(4). Ob¬ 
tenga la matriz Pascal triangular inferior A = abs(pascal(4,l) y test ¡nv(S) = ¡nv(A')* 
inv(A). 

47. Si A = ones(4,4) y b = rand(4,l), ¿cómo le hace saber MATLAB que Ax = b no tiene 
solución? Si b — ones(4,l), ¿qué solución de Ax = b se encuentra por medio de A\b7 

48. M~ l muestra el cambio en A -1 (lo cual es útil saber) cuando una matriz se resta de A. 
Compruebe el siguiente inciso 3 cuidadosamente, multiplicando M M~ 1 para obtener I: 


1. 

Af = I - 

uv r 

y 


= / + «u T /( 1 — v T u). 

2. 

M — A — 

uv T 

y 

M~ l 

= A- 1 + A -1 uu T A -1 /(l 

3. 

M — I — 

UV 

y 

M-' 

= i n + u{i m - vur l v. 

4. 

M — A — 

UW~ l V 

y 

M~ l 

= A -1 + A-‘U(W - VA 


Las cuatro identidades provienen del bloque 1, 1 luego de que se invierten las siguien¬ 
tes matrices: 


A U 
V W ' 


Los problemas 49 a 55 son sobre las reglas para trasponer matrices. 

49. Encuentre A T y A -1 y (A _1 ) T y (A T ) -1 para 


y también A 


1 c 
c 0 


50. Compruebe que (AB) T es igual a B T A T , aunque éstas son diferentes de A T B T : 

. fl °1 « f 1 3] [1 3] 

A = 2 i B= o ! Ai? =2 -j ■ 

En caso de que AB = BA (¡lo cual en general no es cierto!), ¿cómo puede demostrar 
que B T A T = A T B T ? 

51. a) La matriz ((AB)" 1 ) 1 " proviene de (A“ I ) T y (B~ l ) T . ¿En qué orden ? 

b)Si U es triangular superior, entonces ( U~ l ) T es __triangular. 

52. Demuestre que A 2 = 0 es posible pero A T A = 0 no es posible (a menos que A = ma¬ 
triz cero). 
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53. a) Al multiplicar el vector renglón x T por la columna y, ¿qué número se obtiene? 



b) Este es el renglón x r A = ___ veces la columna y = (0, 1, 0). 

c) Este es el renglón x T = [0 1] veces la columna Ay =_. 

54. Cuando se traspone una matriz en bloque M = [£ £], el resultado es M T = _. 

Pruébelo. ¿Qué condiciones deben imponerse a A,B,C,D para que la matriz en bloque 
sea simétrica? 

55. Explique por qué el producto interno de x y y es igual al producto intemo de Px y Py. 
Luego, ( Px) r (Py ) = x T y, indica que P T P = I para cualquier permutación. Con x = (1, 
2, 3) y y = (1, 4, 2), escoja P para demostrar que (Px) T y no es siempre igual a x T (P T y). 


Los problemas 56 a 60 son sobre matrices simétricas, y sus factorizaciones. 

56. Si A = A t y B = B T , ¿cuáles de las siguientes matrices son ciertamente simétricas? 

a) A 2 -B 2 b) (A + B)(A -B) c) ABA d) ABAB 

57. Si A = A t requiere un intercambio de renglones, entonces también necesita un inter¬ 

cambio de columnas para permanecer simétrica. En lenguaje de matrices, PA pierde la 
simetría de A pero_recupera la simetría. 

58. a) ¿Cuántos elementos de A pueden elegirse independientemente, si A = A r es de 5 

por 5? 

b) ¿De qué manera pueden L y D (de 5 por 5) proporcionar el mismo número de op¬ 

ciones en LDL r ? 


59. Suponga que R es rectangular (de m por n) y que A es simétrica (de m por m). 

a) Trasponga R r AR para mostrar su simetría. ¿De qué forma es esta matriz? 

b) Demuestre por qué R r R no contiene números negativos en su diagonal. 

60. Factorice las siguientes matrices en A = LDlJ. La matriz D es diagonal: 



y 




Los tres siguientes problemas son sobre aplicaciones de (Ax) T y — x T (A T y). 

61. Las ciudades de Boston, Chicago y Seattle están conectadas con cables que conducen 
energía eléctrica. Los voltajes que reciben estas ciudades son x B , x c , x s . Con resisten¬ 
cias unitarias entre las ciudades, las tres comentes están en y: 

Tbc 1—1 0 x B 

y = Ax es yes — 0 1—1 xc ■ 

y B s_ _1 0 —1_ _T S - 

a ) Encuentre las corrientes totales A T y de las tres ciudades. 

b) Compruebe que (Ax) T y coincide con x T (A T y): hay seis términos en cada una. 

62. La producción de Xj camiones y x 2 aviones requiere jq + 50x 2 toneladas de acero, 
40x t + lOOCbq libras de caucho, y 2xj + 50x 2 meses de trabajo. Si los costos unita- 
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rios y u y 2 , y 2 son $700 por tonelada, $3 por libra, y $3000 por mes, ¿cuáles son los va¬ 
lores de un camión y un avión? Éstas son las componentes de A T y. 

63. Ax proporciona las cantidades de acero, caucho y trabajo para producir x en el proble¬ 
ma 62. Encuentre A. Luego (Ax) T y es el_de entradas, mientras x T (A T y) es el va¬ 
lor de_. 

64. A continuación se presenta otra factorización de A en una triangular multiplicada por 
una simétrica: 

Se empieza con A = LDU. Luego, A es igual a L(U T )~ 1 por U T DU. 

¿Por qué es triangular L(í/ r )~ 1 ? En su diagonal sólo hay ls. ¿Por qué es simétrica 
U t DU1 

65. Un grupo de matrices incluye a AB y A -1 si incluye a A y B. “Los productos y las in¬ 
versas permanecen en grupos.” ¿Cuáles de los siguientes conjuntos son grupos? Las 
matrices triangulares inferiores L con ls en su diagonal, las matrices simétricas S, las 
matrices positivas M, las matrices diagonales invertibles D, las matrices de permuta¬ 
ción P. Invente dos grupos de matrices más. 

66 . Si todo renglón de una matriz de 4 por 4 contiene a los números 0, 1, 2, 3 en algún or¬ 
den, ¿la matriz puede ser simétrica? ¿Puede ser invertible? 

67. Demuestre que ningún reordenamiento de renglones ni de columnas puede trasponer 
una matriz típica. 

68 . Una matriz noroeste cuadrada B es cero en la esquina sureste, abajo de la antidiago¬ 
nal que une (1, n) con (n, 1). B r y B 2 , ¿son matrices noroeste? B~ l , ¿es noroeste o su¬ 
reste? ¿Cuál es la forma de BC = noroeste multiplicada por sureste ? Se permite com¬ 
binar permutaciones con las L y U de costumbre (suroeste y noreste). 

69. Compare tic; mv(A); toe para A = rand(500) y A = rand(1000). El conteo n 3 indica 
que el tiempo de cómputo (medido por tic; toe) debe multiplicarse por 8 cuando n se 
duplica. ¿Cree el lector que esta A aleatoria es invertible? 

70. / = eye(1000); A = rand(1000); B — triu(A); produce una matriz triangular aleatoria 
B. Compare los tiempos para inv(S) y B\l. La diagonal al revés se somete a ingenie¬ 
ría con la finalidad de utilizar los ceros en B, mientras inv utiliza los ceros en / cuan¬ 
do [B I] se reduce por Gauss-Jordan. (También compare con inv(A) y A\/para toda la 
matriz A.) 

71. Demuestre que ir 1 tiene elementos j/i para i :£ j (la matriz -1, 2,-1 tiene esta L): 

'íoooi ri o o o' 

L- 'i 1 0 0 y L -= L 2 1 0 0 

01 o y I ¡ 1 0 • 

o 0 -- 1 Lili 

L uu 4 1 J l_4 4 4 J 

Pruebe este patrón para L = eye(5) - diag(l:5) “diag(l:4,—1) e inv(L). 

1.7 MATRICES ESPECIALES Y APLICACIONES 

Esta sección tiene dos objetivos. El primero consiste en explicar una forma en la que grandes 

sistemas lineales Ax = b pueden presentarse en la práctica. La verdad es que un problema 

grande y realista en ingeniería o economía nos llevaría demasiado lejos del alcance de este li¬ 
bro, aunque hay una aplicación natural e importante que no requiere mucha preparación. 
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El otro objetivo consiste en ilustrar, aprovechando la misma aplicación, las propieda¬ 
des especiales que suelen tener las matrices de coeficientes. Las matrices grandes siempre 
presentan un patrón definido; a menudo un patrón de simetría, y muchísimos elementos 
iguales a cero. Debido a que una matriz “holgada” contiene mucho menos de n 2 piezas de 
información, los cálculos deben ser rápidos. Se abordarán las matrices banda, con la fina¬ 
lidad de ver cómo la concentración cerca de la diagonal acelera la eliminación. De hecho, 
se analiza una matriz tridiagonal especial. 

La matriz misma puede verse en la ecuación ( 6 ). Proviene del intercambio de una 
ecuación diferencial con una ecuación matricial. El problema continuo pide por n(x) en ca¬ 
da x, por lo que una computadora no es capaz de resolverlo exactamente. Debe ser aproxi¬ 
mado por un problema discreto: mientras más incógnitas se tienen, mejor es la precisión y 
mayor el gasto. Como un problema continuo sencillo aunque también bastante típico, nues¬ 
tra elección se dirige a la ecuación diferencial 

“S = /<*>• 0 < x < 1 . ( 1 ) 

dx 1 

Esta es una ecuación lineal para la función incógnita n(x). Cualquier combinación 
C + Dx puede sumarse a cualquier solución, ya que la segunda derivada de C + Dx no 
contribuye con nada. La incertidumbre que dejan estas dos constantes arbitrarias C y D se 
elimina mediante una “ condición a la frontera” en cada extremo del intervalo: 

k(0)=0, w(1)=0. (2) 

El resultado es un problema de dos puntos con valor en la frontera, que describe un fenó¬ 
meno que no es transitorio, sino de estado estacionario; por ejemplo, la distribución de tem¬ 
peratura en una varilla cuyos extremos están fijos a 0 o , y con una fuente de calor/(x). 

Recuerde que nuestro objetivo es producir un problema discreto; en otras palabras, un 
problema en álgebra lineal. Es por ello que sólo es posible aceptar una cantidad finita de in¬ 
formación sobre fije), por ejemplo, sus valores en n puntos equidistantes x — h, x = 2h,..., 
x = nh. Para la solución verdadera u se calculan valores aproximados en esos 

mismos puntos. En los extremos x = 0yx = 1 — (n + 1 )h, los valores en la frontera son 
«o = 0 y u n+ i = 0. 

La primera pregunta es: ¿Cómo se sustituye la derivada d 2 u/dx 2 1 La primera deriva¬ 
da puede ser aproximada deteniendo An/Ax en un tamaño de paso finito, y no permitiendo 
que h (o Ax) tienda a cero. La diferencia A u puede ser hacia adelante, hacia atrás, o cen¬ 
trada: 


Au k(x + h) — m(x) u(x) — u(x — h) u(x + h) — u(x — h) 

- = —-obten, - obten, ——-. (3) 

Ax h h 2 h 

La última expresión es simétrica respecto a x, y es la más precisa. Para la segunda deriva¬ 
da hay justo una combinación que sólo utiliza los valores de x y x±h: 


Segunda diferencia 


d 2 u A 2 u _ m(x + h) — 2k(x) + u(x — h) 
dx 2 Ax 2 h 2 


(4) 


Lo anterior también tiene el mérito de ser simétrico con respecto a x. Para repetir, el miem¬ 
bro derecho tiende al valor verdadero de d 2 uldx 2 cuando h—*■ 0 , aunque es necesario de¬ 
tenerse en una h positiva. 

En cada punto de la malla, x = jh, la ecuación — d z u/dx 2 = fix) se sustituye por su 
análogo discreto (5). Se multiplicó por h 2 para alcanzar n ecuaciones Au = b: 


Ecuación en diferencias —m /+ , +2 u¡ - uj-i ~h 2 f{jh) para j - 1,..., n. (5) 


Las ecuaciones primera y última (7 = 1 y j = n) incluyen u 0 = 0 y u n + 1 = 0, que se cono¬ 
cen a partir de las condiciones a la frontera. Estos valores deben desplazarse al miembro 
derecho de la ecuación si se desea que sean distintos de cero. La estructura de estas n ecua- 





Capítulo 1 Matrices y eliminación gaussiana 


ciones (5) puede visualizarse mejor en forma matricial. Se escoge h = | para obtener una 
matriz A de 5 por 5: 


Ecuación matricial 


U\ 

-1 u 2 

2 — 1 «3 
1 2 1 i¿4 

— 1 2 u¡ 


'f(h) ‘ 
f(2h) 
= h 2 f(3h) 
f(4h) 
f(5h) 


A partir de este momento se trabajará con la ecuación (6). Tiene una matriz de coeficien¬ 
tes bastante regular, cuyo orden n puede ser muy grande. La matriz A tiene muchas propie¬ 
dades especiales, de las cuales tres son fundamentales: 

1. La matriz A es tridiagonal. Todos los elementos diferentes de cero están en la diago¬ 
nal principal y en las dos diagonales adyacentes. Fuera de esta banda todos los ele¬ 
mentos son a¡j = 0. Estos ceros traerán una simplificación considerable para la elimi¬ 
nación gaussiana. 

2. La matriz es simétrica. Cada elemento a¡¡ es igual a su imagen especular a jt , de modo 
que A t = A. La triangular superior V es la traspuesta de la triangular inferior L, y 
A = LDL r . Esta simetría de A refleja la simetría de dfu/dx 1 . Una derivada impar có¬ 
mo duídx o d^u/dx 3 destruiría la simetría. 

3. La matriz es positiva definida. Esta propiedad adicional indica que los pivotes son po¬ 
sitivos. Los intercambios de renglones son innecesarios en la teoría y en la práctica. 
Esto contrasta con la matriz B, al final de esta sección, que no es positiva definida. Sin 
ningún intercambio de renglones, es totalmente vulnerable al redondeo. 

La característica de positiva definida reúne todo este curso (¡en el capítulo 6!) 

Ahora se vuelve al hecho de que A es tridiagonal. ¿Cuál es el efecto de esto en la eli¬ 
minación? La primera etapa del proceso de eliminación produce ceros abajo del primer 
pivote: 


Eliminación 
en A: Paso 1 


En comparación con una matriz general de 5 por 5, este paso presenta dos simplificaciones 
importantes: 

1. Abajo del pivote sólo hay un elemento diferente de cero. 

2. El renglón del pivote es muy corto. 

El multiplicador € 2 i = — j proviene de una división. El nuevo pivote, |, proviene de una 
simple multiplicación-sustracción. Además, se preserva el patrón tridiagonal : Toda etapa 
de la eliminación acepta las simplificaciones a) y b ). 

El resultado final es la factorizacion LDU ™ LDLf de A. ¡Observe los pivotes! 


" 2-1 


'2 -1 

-1 2 -1 


0 | -1 

-1 2 -1 

—> 

-1 2 -1 

-1 2 -1 


-1 2 -1 

-1 2 


-1 2 


1 ~5 






a matriz 

nen la misma estructura de banda de tres diagonales esenciales (3 n - 2 parámetros) que A. 
También observe que L y U son traspuestas entre sí, como era de esperar por la simetría. 
Todos los pivotes 2/1, 3/2, 4/3, 5/4, 6/5 son positivos. Su producto es el determinante de 
A: det A = 6 . Resulta evidente que los pivotes convergen a 1 cuando n se hace grande. Es¬ 
tas matrices hacen muy felices a las computadoras. 

Estos factores holgados L y U cambian por completo el conteo de operaciones de cos¬ 
tumbre. La eliminación en cada columna requiere sólo dos operaciones, como arriba, y hay 
n columnas. En vez de las n 3 / 3 operaciones, sólo se necesitan 2n. Los sistemas tridiagona- 
les Ax = b pueden resolverse casi de inmediato. El costo de resolución de un sistema tri¬ 
diagonal es proporcional a n. 

Una matriz de banda tiene a¡, = 0 excepto en la banda | i — j\ < w (véase la figura 
1.8). El “semiancho de banda” es w = 1 para una matriz diagonal, w = 2 para una matriz 
tridiagonal, y w = n para una matriz completa. Para cada columna, la eliminación requie¬ 
re w(w - 1) operaciones: un renglón de longitud w actúa sobre w - 1 abajo. La elimina¬ 
ción en las n columnas de una matriz de banda requiere alrededor de w 2 n operaciones. 






_IU \ 


LU 


Figura 1.8 Una matriz de banda A y sus factores L y U. 

Cuando w tiende a n, la matriz se vuelve completa, y el conteo es aproximadamente n 3 . 
Para un conteo exacto, la esquina inferior del miembro derecho ya no tiene espacio para un 
ancho de banda w. El número preciso de divisiones y multiplicaciones-sustracciones que 
producen L, D, U (sin suponer que A es simétrica) es P = \w(w- l)(3n - 2w + 1). Para 
una matriz completa con w = n, se recupera P = | n(n - 1 )(n + 1). Este es un número en¬ 
tero, ya que n-l,n,yn+ 1 son enteros consecutivos, y uno de ellos es divisible entre 3. 

Este es el último conteo de operaciones, y se recalca la cuestión más importante. Una 
matriz de diferencias finitas como A tiene una inversa completa. Al resolver Ax = b, en rea¬ 
lidad se está en una peor situación si se conoce A -1 que si se conocen L y U. La multipli¬ 
cación de A ~ 1 por b requiere n 2 pasos, mientras para la eliminación hacia adelante y la sus¬ 
titución hacia atrás que producen x = XJ~ x c = U~ x L~ x b = A~ x b, son suficientes 4n pasos. 

Esperamos que este ejemplo haya reforzado la comprensión que el lector tiene sobre 
la eliminación (¡de la cual ahora suponemos que está perfectamente entendida!) Se trata de 
un ejemplo genuino de los grandes sistemas lineales que en realidad se encuentran en la 
práctica. En el siguiente capítulo la atención se centra en la existencia y unicidad de x, pa¬ 
ra m ecuaciones en n incógnitas. 

Error por redondea 

En teoría, el caso no singular se ha completado. Hay un conjunto completo de pivotes (con 
• ' de ’ ' ” ' ' ' ' ‘. 


;ce: 


iS, 


lifcl ■) 
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Dedicaremos dos páginas (completamente opcionales en clase) para hacer más estable la 
eliminación: por qué es necesaria y cómo se lleva a cabo. 

Para un sistema de tamaño moderado, por ejemplo de 100 por 100, la eliminación im¬ 
plica alrededor de 330 000 operaciones (j n 3 ). Con cada operación es necesario esperar un 
error por redondeo. Normalmente, se mantiene fijo un número de dígitos significativos (por 
ejemplo tres para una computadora extremadamente débil). Así, la adición de dos números 
de tamaños diferentes proporciona un error: 

Error por redondeo 0.456 + 0.00123 —> 0.457 pierde los dígitos 2 y 3. 

¿Cómo contribuyen todos estos errores individuales al error final en Ax = ¿>? 

Este problema no es fácil. Fue atacado por John von Neumann, quien era el matemá¬ 
tico más reputado en la época en que las computadoras repentinamente hacían posible un 
millón de operaciones. De hecho, la combinación de Gauss y Von Neumann proporciona 
al simple algoritmo de eliminación una historia extraordinariamente distinguida, aunque 
incluso Von Neumann sobreestimó el error por redondeo final. Quien encontró la forma co¬ 
rrecta para contestar la pregunta fue Wilkinson, cuyos libros se han convertido en clásicos. 

Dos ejemplos sencillos ilustrarán tres cuestiones importantes sobre el error por redon¬ 
deo. Los ejemplo son 

Mal acondicionado A = j' ^ ^ Bien acondicionado B = 

A es casi singular, mientras B está lejos de ser singular. Si el último elemento de A se mo¬ 
difica ligeramente a ¿z 22 = 1, entonces A es singular. Considere dos miembros derechos 
bastante parecidos: 

u + v — 2 u + v = 2 

u + l.OOOlu =2 y u + l.OOOlu = 2.0001 

La solución del primero es u = 2, v = 0. La solución del segundo es u = v = 1. Un cam¬ 
bio en el quinto dígito de b fue amplificado a un cambio en el primer dígito de la solución. 
Ningún método numérico es capaz de evitar esta sensibilidad a pequeñas perturbaciones. 
El mal acondicionamiento puede desplazarse de un lado a otro, pero no es posible eliminar¬ 
lo. La verdadera solución es muy sensible, y la solución calculada no puede dejar de serlo. 
El segundo punto es como sigue. 

10 Incluso una matriz bien acondicionada como B puede ser arruinada por un al- 
goritmo deficiente. ' 

Lamentamos decir que para la matriz B, la eliminación gaussiana directa es un algoritmo 
deficiente. Suponga que .0001 es aceptado como el primer pivote. Luego, 10 000 veces el 
primer renglón se resta del segundo. El elemento inferior derecho se convierte en -9999, 
pero el redondeo hasta tres cifras proporcionaría -10 000. Cualquier traza del elemento 1 
desaparecería: 

Eliminación en B con 0.000lw + v — 1 O.OOOlw + v = 1 

un pivote pequeño u + v = 2 > —9999v = —9998. 

El redondeo produce -10 000i> = —10 000, o bien v = 1. Esto es correcto hasta tres cifras 
decimales. La sustitución hacia atrás con el v = .9999 correcto proporciona u = 1: 


0.0001 1 / 

1 . 1 ./ 
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Resultado correcto O.OOOln + 0.9999 = 1, o bien, u — 1. 

En vez de lo anterior, al aceptar v = 1, que es erróneo sólo en la cuarta cifra decimal, se 
obtiene u = 0 : 

Resultado erróneo 0.000 lu + 1 = 1, o bien, u = 0. 

La u calculada es completamente errónea. B está bien acondicionada pero la eliminación 
es violentamente inestable. L, D, y U están completamente fuera de escala con B : 

1 0 ] [ 0.0001 0 ] [1 10 000 ' 

10 000 lj L 0 -9999J [0 1 

El pequeño pivote 0.0001 trajo insensibilidad, y el remedio es evidente: intercambiar 
renglones. 

1P Un pivote pequeño obliga a un cambio práctico en la eliminación. Normalmen¬ 
te, cada pivote se compara con todos los posibles pivotes en la misma columna. In¬ 
tercambiar renglones para obtener el pivote más grande posible se denomina pivoteo 
parcial. 

Para B, el pivote 0.0001 podría compararse con el pivote posible 1 que está abajo de él. Un 
intercambio de renglones tendría lugar de inmediato. En términos matríciales, esta es una 
multiplicación por una matriz de permutación P = [° J]. La nueva matriz C — PB tie¬ 
ne buenos factores: 


Los pivotes para C son 1 y 0.9999, mucho mejores que 0.0001 y —9999 para B. 

La estrategia del pivoteo completo también busca en todas las últimas columnas el pi¬ 
vote más grande posible. No sólo podría ser necesario un intercambio de renglones, sino 
también uno de columnas. (Esto es la posmultiplicación, por una matriz de permutación). 
La dificultad al ser tan conservador es el gasto, y el pivoteo parcial es bastante adecuado. 

Finalmente se ha llegado al algoritmo fundamental del álgebra lineal numérica: la eli¬ 
minación con pivoteo parcial. Algunos refinamientos adicionales, como, ver si es nece¬ 
sario reescalar todo un renglón o toda una columna siguen siendo posibles. Pero esencial¬ 
mente, el lector sabe ahora lo que hace una computadora con un sistema de ecuaciones 
lineales. En comparación con esta descripción “teórica” —encontrar A^ 1 , y multiplicar 
A~ 1 b — nuestra descripción ha consumido bastante del tiempo (y paciencia) del lector. 
Desearía que hubiese una forma mas fácil de explicar cómo x se encuentra realmente, aun¬ 
que no creo que la haya. 

Conjunto de problemas 1.7 

1. Escriba los factores LDU = LDLf de A en la ecuación ( 6 ) cuando n — 4. Encuentre el 
determinante como el producto de los pivotes en D. 

2. Modifique a u en la ecuación (6) de a n = 2 a a¡¡ = 1, y encuentre los factores LDU 
de esta nueva matriz tridiagonal. 


1 1] = [ 1 0] [l 0 1 [1 

0.0001 lj [0.0001 lj [0 0.9999J [o 
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3. Encuentre la matriz A 0 de 5 por 5 (h = ¿ ) que aproxima 

d 2 u du du 

~7P~ f,A 

sustituyendo estas condiciones a la frontera por u 0 = u x y u 6 = u 5 . Compruebe que 
su A 0 multiplicada por el vector constante (C, C, C, C, C) produce cero; A 0 es sin¬ 
gular . De manera semejante, si u(x) es una solución del problema continuo, enton¬ 
ces también lo es u(x ) + C. 

4. Escriba la ecuación de la matriz de diferencias finitas de 3 por 3 (h = ¿ ) para 


+ u = x. 


u( 0) = u( 1 ) = 0 . 


5. Con h — \ y f(x) — 4 w 2 sen 2-roe, la ecuación en diferencias (5) es 

2 -1 Ol [«i] 2 f 1 * 

-1 2-1 « 2 = 2- 0 . 

0-1 2 J [«aJ 4 [-1 

Resuelva para u¡, u 2 , u 3 y encuentre su error en comparación con la solución verdade¬ 
ra u = sen 2ttx en x = |, x = |, y x = |. 

6 . ¿Cuál es el sistema de 5 por 5 que sustituye a ( 6 ) si las condiciones en la frontera se 
cambian a u( 0 ) = 1 , u(l) = 0 ? 

Los problemas 7 a 11 son sobre el error por redondeo y los intercambios de renglones. 

7. Calcule H~ l en dos formas para la matriz de Hilbert de 3 por 3 

Ti 1 i] 

1 2 3 

H = i I i 

i i i 

.3 4 5 . 

primero por cálculo exacto y luego redondeando cada número hasta tres cifras. Esta 
matriz H está mal acondicionada y los intercambios de renglones no son de utilidad. 

8 . Para la misma matriz H, compare los miembros derechos de Hx = b cuando las solu¬ 
ciones son x = ( 1 , 1 , 1 ) y x = ( 0 , 6 , - 3 . 6 ). 

9. Resuelva Hx = b = (1, 0, . . . , 0) para la matriz de Hilbert de 10 por 10 con h¡j = 
l /( 2 + j - 1), usando cualquier código de computadora para ecuaciones lineales. Lue¬ 
go, intercambie un elemento de b por . 0001 , y compare las soluciones. 

10. Compare los pivotes en eliminación directa con los del pivoteo parcial para la siguien¬ 
te matriz. 


(En realidad, éste es un ejemplo que requiere reescalamiento antes de la eliminación.) 


11. Explique por qué el pivoteo parcial produce multiplicadores Zy en L que satisfacen ¡Z ¿ j 
- L ¿Puede proporcionar un ejemplo de 3 por 3 con todos los \a¿} < 1 cuyo último 
pivote sea 4? Este es el peor de los casos, ya que cada elemento es cuando mucho mul¬ 
tiplicado por 2 cuando ¡Zy¡ < 1 . 


Ejercicios de repaso 
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Ejercicios de repaso 

1.1 a) Escriba las matrices de 3 por 3 con elementos 


b) Calcule los productos AB, BA y A 2 . 
1.2 Para las matrices 


calcule AB y BA y A l y B 1 y (AB) ‘. 

1.3 Encuentre ejemplos de matrices de 2 por 2 con a l2 = \ para las cuales 

a) A 2 = I. b) A” 1 = A t . c) A 2 = A. 

1.4 Resuelva por eliminación y sustitución hacia atrás. 

u + w = 4 v + w = 0 

u + v =3 y u + w = 0 
u + v + w = 6 u + v —6. 

1.5 Factorice las matrices precedentes en A = LU o bien PA = LU. 

1.6 a) Hay 16 matrices de 2 por 2 cuyos elementos son ls y Os. ¿Cuántas son invertibles? 
b) (¡Mucho más difícil!) Si al azar se escriben ls y Os en los elementos de una ma¬ 
triz de 10 por 10, ¿qué es más probable: que la matriz sea invertible o que sea 
singular? 

1.7 Hay 16 matrices de 2 por 2 cuyos elementos son ls y -ls. ¿Cuántas son invertibles? 

1.8 ¿Cómo están relacionados los renglones de EA con los renglones de A en los casos 
siguientes? 


1 0 0 

E — 0 2 0 o bien, E 

4 0 1 


1 1 1 
0 0 0 


o bien, E 


0 0 1 
0 1 0 
1 0 0 


1.9 Escriba un sistema de 2 por 2 que tenga una infinidad de soluciones. 

1.10 Encuentre inversas, si existen, por inspección o por eliminación de Gauss-Jordan: 


1 0 1 
1 1 0 
0 1 1 


2 1 6 
1 2 1 
0 1 2 


1.11 Si E es de 2 por 2 y suma la primera ecuación a la segunda, ¿cuáles son las matrices 
E 2 y E 8 y 8 E7 

1.12 ¿Falso o verdadero? Proporcione una explicación si es verdadero y un contraejem¬ 
plo si es falso: 

1) Si A es invertible y sus renglones aparecen en orden invertido en B, entonces B 
es invertible. 
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2) Si A y B son simétricas, entonces AB es simétrica. 

3) Si A y B son invertibles, entonces BA es invertible. 

4) Toda matriz no singular puede factorizarse en el producto A — LU de una trian¬ 
gular inferior L y una triangular superior U. 

1.13 Resuelva Ax = b resolviendo los sistemas triangulares Le — b y Ux = c: 

'1 0 0] [2 2 4] [0' 

A = LU =410 013, b = 0 . 


[1 0 1J [0 0 lj L 1 

¿Qué parte de A~ 1 encontró con esa b particular? 

1.14 De ser posible, encuentre matrices B de 3 por 3 tales que 

a) BA = 2A para toda A. 

b) BA = 2 B para toda A. 

c ) BA tenga los renglones primero y último de A, invertidos. 

d) BA tenga las columnas primera y última de A, invertidas. 

1.15 Encuentre el valor de c en la siguiente inversa de n por n. 


si A = 


1.16 ¿Para qué valores de k el sistema 

kx + y = 1 
x + ky = 1 

no tiene solución, tiene una, solución, o bien tiene una infinidad de soluciones? 

1.17 Encuentre la factorización simétrica A = LDL T de 


n 

-1 

■ -r 



c 

1 

f 

-1 

n 

• -i 

entonces A 

_ 1 

1 

c 

. 1 

• 1 

1 c 

-1 

-1 

• -i 

— 1 n 


n + 1 

1 

1 


1 2 0 ' 
2 6 4 

0 4 11 


a b 
b c ' 


1.18 Suponga que A es la matriz identidad de 4 por 4, excepto por un vector v en la co¬ 
lumna 2: 

'1 m 0 0' 

. 0 V 2 0 0 

A “ 0 v 3 1 0 ' 

0 V4 0 1 

a) Factorice A en LU, suponiendo v 2 ¥= 0. 

b) Encuentre A - \ que tiene la misma forma que A. 

1.19 Resuelva por eliminación, o demuestre que no hay solución: 


u. + v + w = 0 
u + 2v + 3w — 0 
3u + 5v + 7w — 1 


u + v + iv = 0 
u + v + 3tu = 0 
3u + 5v + 7w = 1. 


1.20 Las matrices de permutación de n por n constituyen un ejemplo importante de un 
“grupo”. Si se multiplican, se sigue permaneciendo dentro del grupo: tienen inversas 


[ÍkT«1 


¡»ra 




por 4 y de n por n? 

b) Encuentre una potencia k de modo que todas las matrices de permutación de 3 
por 3 cumplan P k = I. 

1.21 Describa los renglones de DA y las columnas de AD si o = [ 2 ®]. 

1.22 a) Si A es invertible, ¿cuál es la inversa de A T ? 

b) Si A también es simétrica, ¿cuál es la traspuesta de A - '? 

c) Ilustre ambas fórmulas cuando A = [ 2 !]. 

1.23 Experimente con n = 2 y n — 3, para encontrar 


1.24 Empiece con un primer plano u + 2v — iv = 6, para encontrar la ecuación de lo si¬ 
guiente: 

a) El plano paralelo que pasa por el origen. 

b) Un segundo plano que también contenga los puntos (6, 0, 0) y (2, 2, 0). 

c) Un tercer plano que se corte con los planos primero y segundo en el punto (4,1,0). 

1.25 ¿Qué múltiplo del renglón 2 se resta del renglón 3 en la eliminación hacia adelante 
de A? 


'1 

0 

0 ' 

"1 

2 

0 ' 

A = 2 

1 

0 

0 

1 

5 

0 

5 

1 

0 

0 

1 


¿Cómo sabe el lector (sin multiplicar estos factores) que A es invertible, simétrica, y 
tridiagonal ? ¿Cuáles son los pivotes? 

1.26 a) ¿Cuál es el vector x que hace Ax = columna 1 de A 4- 2(columna 3), para una 

matriz A de 3 por 3? 

b) Obtenga una matriz que cumpla columna 1 + 2(columna 3) = 0. Compruebe que 
A es singular (menos de 3 pivotes), y explique por qué, éste debe ser el caso. 

1.27 ¿Falso o verdadero? Proporcione un contraejemplo si es falso, y una explicación si 
es verdadero: 

1) Si L X U\ = LiU-i (las matrices U son triangulares superiores con diagonal diferen¬ 
te de cero, y las matrices L son triangulares inferiores con diagonal de Is), enton¬ 
ces L t = ¿2 Y U x = U 2 ■ La factorización LU, es única. 

2) Si A 2 + A = /, entonces A" 1 = A + I. 

3) Si todos los elementos en la diagonal de A son cero, entonces A es singular. 

1.28 Al tanteo o con la eliminación de Gauss-Jordan calcule 


1 0 0 
l 1 0 

m 0 1 


1 0 0 
i 1 0 

m 0 1 


1 0 0 
l 1 0 

0 m I 
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1.29 Escriba las matrices de 2 por 2, tales que 

a) Invierten la dirección de cada vector. 

b) Proyectan cada vector sobre el eje x 2 . 

c ) Hacen girar 90° a cada vector en sentido contrario al sentido de movimiento de 
las manecillas del reloj. 

d) Reflejan cada vector a 45° respecto a la recta x l = x 2 . 


! 



Espacios vectoriales 


2.1 ESPACIOS Y SUBESPACIOS VECTORIALES 

La eliminación puede simplificar, elemento por elemento, el sistema lineal Ax = b. Por for¬ 
tuna, también simplifica la teoría. Las preguntas básicas de existencia y unicidad: ¿existe 
una solución?, ¿no existe ninguna solución?, o bien, ¿existe una infinidad de soluciones? 
Todas estas preguntas podrán responderse más fácilmente después de aplicar la elimina¬ 
ción. Para tratar estas interrogantes se requiere una sección más, con la finalidad de encon¬ 
trar todas las soluciones para un sistema de m por n. Así el ciclo de ideas estará completo. 

Sin embargo, la eliminación sólo produce un tipo de entendimiento sobre Ax — b. 
Nuestro objetivo principal es lograr una comprensión distinta y más profunda. Se trata del 
corazón del álgebra lineal. 

Para la noción de espacio vectorial , de inmediato se empieza con los espacios más im¬ 
portantes, que se denotan por R 1 , R 2 , R 3 , ... ; el espacio R" consta de todos los vectores co¬ 
lumna con n componentes. (Se escribe R porque los componentes son números reales). R 2 se 
representa por el plano x-y de costumbre; las dos componentes del vector se convierten en las 
coordenadas x y y del punto correspondiente. Las tres componentes de un vector en R 3 pro¬ 
porcionan un punto en el espacio tridimensional. El espacio unidimensional R 1 es una recta. 

Lo importante para el álgebra lineal es que la extensión a n dimensiones es directa. Pa¬ 
ra un vector en R 7 sólo se requieren siete componentes, incluso si es difícil visualizar la 
geometría. En todos los espacios vectoriales son posibles dos operaciones: 

Es posible sumar dos vectores cualesquiera, y todos los vectores pueden multipli¬ 
carse por escalares. 

En otras palabras, puede trabajarse con combinaciones lineales. 

La suma obedece la ley conmutativa x + y = y + x; existe un “vector cero” que cumple 
0 + x = x; y hay un vector x” que satisface — x + x = 0. Ocho propiedades (incluyen¬ 
do las tres anteriores) son fundamentales: la lista completa se proporciona en el problema 
5 al final de esta sección. Un espacio vectorial real es un conjunto de vectores junto con 
reglas para la suma vectorial y la multiplicación por números reales. La suma y la mul¬ 
tiplicación deben producir vectores en el espacio, y deben cumplir las ocho condiciones. 

Normalmente, estos ocho vectores pertenecen a uno de los espacios R"; son vectores 
columna normales. Si x — (1, 0, 0, 3), entonces las componentes de 2x (y también de x + x) 
son 2, 0, 0, 6. La definición formal permite que otros entes sean “vectores”, en el supuesto 
de que la adición y la multiplicación por escalares estén bien. Se proporcionan tres ejemplos: 
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1. El espacio dimensional infinito R“ Sus vectores tienen una infinidad de componen¬ 
tes, como en x = ( 1 , 2, 1 , 2 ,. . .)■ Las leyes para x + y y ex permanecen sm cambio. 

2. El espacio de las matrices de 3 por 2. ¡En este caso los “vectores” son matrices! Es 
posible sumar dos matrices, y A + B = B + A\ existe una matriz cero, etc. Este espa¬ 
cio es casi el mismo que R 6 . (Las seis componentes están dispuestas en un rectángu¬ 
lo, en vez de en una columna.) Cualquier elección demyn proporcionaría, como 
ejemplo semejante, el espacio vectorial de todas las matrices de m por n. 

3. El espacio de las funciones /(x). Aquí se admiten todas las fondones / que están de¬ 
finidas en un intervalo fijo, por ejemplo 0 £ x ss 1. El espacio incluye a/(x) xrí 
g(x) = sen x, su suma (f+ g)(x) = x 2 + sen x, y todos los múltiplos como 3^ y - sen 
x. Los vectores son funciones, y la dimensión es de alguna manera un infinito más 
grande que para R”. 

En los ejercicios se proporcionan otros ejemplos, pero los espacios vectoriales que más 
requerimos, están en otra parte: se encuentran dentro de los espacios estándares R". De¬ 
seamos describirlos y explicar por qué son importantes. Geométricamente, piense en el es¬ 
pacio tridimensional de costumbre R 3 y elija cualquier plano que pase por el origen. Ese 
plano es un espacio vectorial por derecho propio. Si un vector en el plano se multiplica por 
3, o por —3, se obtiene un vector en el mismo plano. Si se suman dos vectores en el plano, 
su suma permanece en el plano. Este plano que pasa por (0, 0, 0) ilustra uno de los concep¬ 
tos más importantes en el álgebra lineal; se trata de un subespacio del espacio original R . 

DEFUNCIÓN Un subespacio de un espacio vectorial es un conjunto no vacío que satisfa¬ 
ce los requisitos de un espacio vectorial: las combinaciones lineales permanecen en el 
subespacio. 

i) Si se suman dos vectores cualesquiera en el subespacio, x. + y está en el subespacio. 

ii) Si cualquier vector x en el subespacio se multiplica por cualquier escalar c, ex está en 

el subespacio. _______ 

Observe cómo se recalca la palabra espacio. Un sub espacio es un subconjunto cerra¬ 
do” bajo la suma y la multiplicación por un escalar. Estas operaciones cumplen las reglas 
del espacio huésped, ya que se sigue estando dentro del subespacio. Las ocho propieda¬ 
des requeridas siguen cumpliéndose en el espacio más grande, por lo que se cumplen au¬ 
tomáticamente en todo subespacio. Observe en particular que el vector cero pertenece a 
todo subespacio. Este hecho se debe a la regla ii): el escalar se escoge como c - 0. 

El subespacio más pequeño Z contiene sólo un vector: el vector cero. Se trata de un 
“espacio con dimensión cero”, que sólo contiene el punto en el origen. Las reglas i) y n) se 
cumplen, ya que la suma 0 + 0 está en este espacio con un punto, así como todos los mul¬ 
tiplicadores cO. Este es el espacio vectorial más pequeño posible : el espacio vacío no esta 
permitido. En el otro extremo, el subespacio más grande es todo el espacio original. Si el 
espacio original es R 3 , entonces es fácil describir los subespacios posibles: R mismo, cual¬ 
quier plano que pase por el origen, cualquier recta que pase por el origen, o sólo el ongen 

(el vector cero). _ . 

La diferencia entre un subconjunto y un subespacio se aclarará mediante ejemplos, bn 
cada caso, ¿es posible sumar vectores, y multiplicar por escalares sin salir del espacio? 

Ejemplo 1 Considere todos los vectores en R 2 cuyas componentes son positivas o cero. Este subcon¬ 
junto es el primer cuadrante del plano x-y\ las coordenadas satisfacen x 5= 0 y y — 0. No es 
un subespacio , aunque contiene al cero, y la adición permanece dentro del subconjunto. Se 
viola la regla ii), ya que si el escalar es —1 y el vector es [1 1 ], entonces el múltiplo 
ex = [— i — 1 ] está en el tercer cuadrante, no en el primero. 
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Si se incluye el tercer cuadrante junto con el primero, la multiplicación por un escalar 
está bien. Todo múltiplo ex permanece en este subconjunto. No obstante, ahora se viola la 
regla i), ya que al sumar [ 12 ]-+- [—2 — 1 ] se obtiene [—1 1 ], que no está en ninguno de los 
cuadrantes mencionados. El menor subespacio que contiene al primer cuadrante es todo el 
espacio R 2 . 

Ejemplo 2 Empiece por considerar el espacio vectorial de todas las matrices de 3 por 3. Un subespa¬ 
cio posible es el conjunto de las matrices triangulares inferiores. Otro es el conjunto de las 
matrices simétricas. A + B y cA son triangulares inferiores si A y B son triangulares infe¬ 
riores, y son simétricas siAyB son simétricas. Por supuesto, la matriz cero, está en ambos 
subespacios. 

El espacio columna de A 

A continuación se proporcionan los ejemplos clave: el espacio columna y el espacio nu¬ 
lo de una matriz A. El espacio columna contiene a todas las combinaciones lineales de 
las columnas de A. Es un subespacio de R m . Se ilustra con un sistema de m = 3 ecuacio¬ 
nes en n = 2 incógnitas: 

"1 0 ] r p>f 

La combinación de las columnas es igual a b 54 U = b 2 . (1) 

2 4J L Ü J [¿3. 

Con m > n se tienen más ecuaciones que incógnitas; en cuyo caso normalmente no hay so¬ 
lución. El sistema sólo es resoluble para un subconjunto muy “delgado” de todas las bs po¬ 
sibles. Una forma para describir este subconjunto delgado, es tan simple que es fácil 
ignorarla. 

2A El sistema Ax = b es resoluble si y sólo si el vector b puede expresarse como 
una combinación de las columnas de A. Por tanto, b está en el espacio columna. 

Esta descripción sólo implica un replanteamiento d c Ax = b por columnas : 

'll [ 0 ] [V 

Combinación de columnas u 5 + v 4 = b 2 . (2) 

2 J |4J LA 

Estas son las mismas tres ecuaciones en dos incógnitas. Ahora el problema es: encontrar nú¬ 
meros u y v que multiplican a las columnas primera y segunda para producir b. El sistema es 
resoluble exactamente cuando estos coeficientes existen, y el vector («, v) es la solución x. 

Se está afirmando que los miembros derechos obtenibles b son todas las combinaciones 
de las columnas de A. Un miembro derecho posible es la columna en sí; los pesos son u = 1 
y v = 0. Otra posibilidad es la segunda columna: u = 0 y v = 1. Otra tercera posibilidad es 
el miembro derecho b = 0. Con u = 0 y v = 0, el vector b = 0 siempre puede obtenerse. 

Es posible describir todas las combinaciones de las dos columnas geométricamente; 
Ax = b puede resolverse si y sólo si b está en el plano generado por los dos vectores co¬ 
lumna (véase la figura 2.1). Este es el conjunto delgado de bs obtenibles. Si b está fuera del 
plano, entonces no es una combinación de las dos columnas. En ese caso Ax = b no tiene 
solución. 

Lo importante es que este plano no sólo es un subconjunto de R 3 ; es un subespacio. 
Se trata del espacio columna de A, que consta de todas las combinaciones lineales de las 
columnas. Se denota por C(A). Es fácil comprobar los requerimientos i) y ii) para un subes¬ 
pacio de R m : 
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Figura 2.1 El espacio columna C(A), un plano en el espacio tridimensional. 

i) Suponga que b y b' están en el espacio columna, de modo que Ax — b para alguna x 
y Ax' — b' para alguna x'. Luego, A(x + x') = b + b', de modo que b + b' también 
es una combinación de las columnas. El espacio columna de todos los vectores obte¬ 
nibles b es cerrado bajo la suma. 

ii) Si b está en el espacio columna C(A), también lo está cualquier múltiplo cb. Si algu¬ 
na combinación de columnas produce b (por ejemplo Ax = b ), entonces al multiplicar 
esa combinación por c produce cb. En otras palabras, A(cx) — cb. 

Para otra matriz A, las dimensiones de la figura 2.1 pueden ser muy distintas. El espa¬ 
cio columna más pequeño posible (con sólo un vector) proviene de la matriz cero A = 0. 
La única combinación de las columnas es b = 0. En el otro extremo, suponga que A es la 
matriz identidad de 5 por 5. Entonces C(J) es todo R 3 ; las cinco columnas de I pueden com¬ 
binarse para producir cualquier vector pentadimensional b. Esto no es en absoluto especial 
de la matriz identidad. Cualquier matriz de 5 por 5 que sea no singular tiene como espa¬ 
cio columna todo R 5 . Para una matriz así, Ax = b puede resolverse por eliminación gaus- 
siana; hay cinco pivotes. En consecuencia, todo b está en C(A) para una matriz no singular. 

Ahora puede darse cuenta de cómo el capítulo 1 está contenido en este capítulo. En 
aquél se estudiaron matrices de n por n cuyo espacio columna es R" Ahora se permiten 
matrices singulares, y matrices rectangulares de cualquier forma. Así, C(A) puede estar en 
alguna parte entre el espacio cero y todo el espacio R m . Junto con este espacio perpendicu¬ 
lar, constituye uno de nuestros dos métodos para comprender Ax = b. 

El espacio nulo de 4 

El segundo método para tratar Ax = b es “dual” al primero. No sólo se tiene interés en 
los miembros derechos obtenibles b, sino también en las soluciones x que los obtienen. 
El miembro derecho b = 0 siempre permite la solución x = 0, aunque puede haber una 
infinidad de otras soluciones. (Siempre hay, en caso de que haya más incógnitas que 
ecuaciones, n > ni). Las soluciones de Ax = 0 constituyen un espacio vectorial: el es¬ 
pacio nulo de A. 
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El espacio nulo de una 
denota por N(A). Es un s 
bespacio de R m . 


Se cumple el requerimiento i): Si Ax = 0 y Ax' = 0, entonces A(x + x') = 0. El requeri¬ 
miento ii) también se cumple: Si Ax = 0 entonces A(cx) = 0. ¡Ambos requerimientos fa¬ 
llan si el miembro derecho no es cero! Sólo las soluciones de una ecuación homogénea 
( b — 0) constituyen un subespacio. Es fácil encontrar el espacio nulo para el ejemplo que 
acaba de proporcionarse; es lo más pequeño posible: 

'1 0 ] r 1 [ 0 ' 

5 4 “ = 0 . 

2 4J H [O 

La primera ecuación proporciona u — 0, y entonces la segunda ecuación obliga a que v = 
0. El espacio nulo sólo contiene al vector (0, 0). Esta matriz tiene “columnas independien¬ 
tes”, un concepto clave que se presentará en breve. 

La situación cambia cuando una tercera columna es una combinación de las dos pri¬ 
meras: 

'1 0 r 

Espacio nulo más grande B = 5 4 9 . 

2 4 6 

B tiene el mismo espacio columna que A. La nueva columna está en el plano de la figura 
2.1; es la suma de los dos vectores columna con los que se empezó. Sin embargo, el espa¬ 
cio nulo de B contiene al vector (1, 1, —1), por lo que automáticamente contiene a cual¬ 
quier múltiplo (c, c, — c): 

"i o ii r ci [o - 

El espacio nulo es una recta 5 4 9 c = 0 . 

2 4 6j |_-cj [0. 

El espacio nulo de B es la recta que contiene a todos los puntos x = c, y = c, z = — c. (La 
recta pasa por el origen, como debe hacer cualquier subespacio). Lo que se desea es poder 
encontrar, para cualquier sistema Ax = b, y encontrar C(A) y N(A): todos los miembros de¬ 
rechos obtenibles b, y todas las soluciones de Ax = 0. 

Los vectores b, están en el espacio columna y los vectores x están en el espacio nulo. 
Se calcularán las dimensiones de estos espacios, y un conjunto idóneo de vectores para ge¬ 
nerarlos. Esperamos terminar comprendiendo todos los cuatro subespacios que están estre¬ 
chamente relacionados entre sí y con A: el espacio columna de A, el espacio nulo de A, y 
sus dos espacios perpendiculares. 

Conjunto de problemas 2,1 

1. Construya un subconjunto del plano x-y R 2 que sea 

a) cerrado bajo la suma y resta, pero no bajo la multiplicación por un escalar. 

b) cerrado bajo la multiplicación por un escalar, pero no bajo la suma vectorial. 
Sugerencia: Empiece con u y v; sume y reste para el inciso a). Intente cu y cv para el 
inciso b). 

2. ¿Cuáles de los siguientes subconjuntos de R 3 son realmente subespacios? 
a) El plano de vectores (b u b 2 , b 3 ) cuya primera componente es b x = 0. 
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b) El plano de vectores b con b¡ = 1. 

c) Los vectores b con b 2 b 3 = 0 (esta es la unión de dos subespacios, el plano 
b 2 — 0 y el plano b 3 = 0 ). 

d) Todas las combinaciones de dos vectores dados (1, 1, 0) y (2, 0, 1). 

e) El plano de vectores (b l , b 2 , b 3 ) que satisface b 3 — b 2 + 3¿q = 0. 

Describa el espacio columna, y el espacio nulo de las matrices 


0 0 


0 0 3 
1 2 3 


0 0 0 
0 0 0 


¿Cuál es el menor subespacio de matrices de 3 por 3 que contiene a todas las matrices 
simétricas, y a todas las matrices triangulares inferiores? ¿Cuál es el mayor subespa¬ 
cio que está contenido en cada uno de estos dos subespacios? 

Se requiere que la suma y la multiplicación por un escalar cumplan las ocho siguien¬ 
tes condiciones: 


1 - x + y = y + x. . ... , 

2 ■ x - (y + z) = (x + y) + z. 

3. Hay un “vector cero” único tal que x + 0 = x para toda x. 

4. Para cada x hay un vector único — x tal que x + (—je) = 0. 
'5, Ix — x. 

6 - (cic 2 )x = c l (c 2 x): 

7. c(x + y) = ex +cy. 

8 . (ci + c 2 )x = c¡x + c 2 x. 


a) Suponga que la adición en R 2 suma un 1 extra a cada componente, de modo que 
(3, 1) + (5, 0) es igual a (9, 2) en vez de (8, 1). Si la multiplicación por un escalar 
permanece sin cambio, ¿qué reglas se rompen? 

b ) Demuestre que el conjunto de todos los números reales positivos con x + y y ex 
vueltos a definir como de costumbre, igual a xy y xf, es un espacio vectorial. ¿Cuál 
es el “vector cero”? 

c) Suponga que (jq, jc 2 ) + (y,, y 2 ) se define como (j:, + y 2 , x 2 + y t ). Con ex = ( cx h 
cx 2 ) de costumbre, ¿cuáles de las ocho condiciones no se cumplen? 

6. Sea P el plano en tres dimensiones con ecuación x + 2y + z — 6. ¿Cuál es la ecua¬ 
ción del plano P 0 que pasa por el origen y es paralelo a P? ¿P y P 0 , son subespacios 

de R 3 ? 

7. ¿Cuáles de los siguientes son subespacios de R°°? 

á) Todas las sucesiones como (1, 0, 1, 0, ...) que incluyen una infinidad de ceros. 

b) Todas las sucesiones (x lt x 2 ,. . .) con x¡ = 0 a partir de un punto. 

c) Todas las sucesiones decrecientes: x J+l s£ Xj para cada j. 

d) Todas las sucesiones convergentes: la Xj tiene límite cuando j -> oo. 

é) Todas las progresiones aritméticas: x J+ , — Xj es la misma para toda j. 

f) Todas las progresiones geométricas (x,, kx l- k?x j,. . .) permitiendo toda k y x { . 

8. ¿Cuáles de las siguientes descripciones con correctas? Las soluciones x de 

. _ n. i ii Xl ro _ 

Ax 1 0 2 * 2 0 


. i ’A 
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constituyan ,"uruguay 

a) Un plano. :1 -— 1 " 

b) Una recta. 

c) Un punto. 

d ) Un subespacio. 

e ) El espacio nulo de A. 

f) El espacio columna de A. 

9. Demuestre que el conjunto de matrices no singulares de 2 por 2 no es un espacio vec¬ 
torial. También demuestre que el conjunto de matrices singulares de 2 por 2 no es un 
espacio vectorial. 

10. La matriz A = I 2 j es un “vector” en el espacio M de todas las matrices de 2 
por 2. Escriba el vector cero en este espacio, el vector | A y el vector —A. ¿Qué ma¬ 
trices están en el menor subespacio que contiene a A? 

11. a) Describa un subespacio de M que contenga a A = o] pero no a B = [o _?]• 

b) Si un subespacio de M contiene a A y a 6 , ¿debe contener a /? 

c) Describa un subespacio de M que contenga matrices diagonales diferentes de cero. 

12. Las funciones/(x) = x 2 y g(x) = 5x son “vectores” en el espacio vectorial F de todas 

las funciones reales. La combinación 3/(x) — 4g(x) es la función h(x) = _. ¿Cuál 

regla se rompe si al multiplicar/(x) por c se obtiene la función/(cx)? 

13. Si la suma de los “vectores”/(x) y g(x) en F se define como/(g(x)), entonces el “vec¬ 
tor cero” es g(x) = x. Considere la multiplicación por un escalar de costumbre c/(x), 
y encuentre dos reglas que no se cumplen. 

14. Describa el menor subespacio del espacio vectorial M de las matrices de 2 por 2 que 
contiene 


10 10 

) 0J y [° i_ ' 

1 ll Ti 0] lo 1] 


[o oj- Lo °J’ 1° iJ’Lo ij- 

15. Sea P el plano en R 3 con ecuación x + y — 2z = 4. ¡El origen (0, 0, 0) no está en P! 
Encuentre dos vectores en P, y compruebe que su suma no está en P. 


16. P 0 es el plano que pasa por (0, 0, 0) y es paralelo al plano P del problema 15. ¿Cuál es 
la ecuación de P 0 ? Encuentre dos vectores en P 0 , y compruebe que su suma está en P 0 . 

17. Los cuatro tipos de subespacios de R 3 son planos, rectas, R 3 mismo, o Z que sólo con¬ 
tiene a ( 0 , 0 , 0 ). 

a) Describa los tres tipos de subespacios de R 2 . 

b) Describa los cinco tipos de subespacios de R 4 . 

18. a) La intersección de dos planos que pasan por (0, 0, 0) probablemente es una___, 

aunque puede ser un . ¡No puede ser el vector cero Z! 

b) La intersección de un plano que pasa por (0, 0, 0) con una recta que pasa por (0, 0, 

0 ) probablemente es un , aunque puede ser un_. 

c ) Si S y T son subespacios de R 5 , su intersección SflT (vectores en ambos subes¬ 
pacios) es un subespacio de R 5 . Compruebe los requerimientos sobre x + y y ex. 
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19. Suponga que P es un plano que pasa por (0, 0, 0) y que L es una recta que pasa por 

(0, 0, 0). El menor espacio vectorial que contiene tanto a P como a L es-o-. 

20. ¿Falso o verdadero? para M = todas las matrices de 3 por 3 (compruebe la suma uti¬ 
lizando un ejemplo). 

a) Las matrices simétricas sesgadas en M (con A T = —A) constituyen un subespacio. 

b) Las matrices simétricas en M (con A T A A) constituyen un subespacio. 

c) Las matrices que tienen a (1, 1, 1) en su espacio nulo constituyen un subespacio. 

Los problemas 21 a 30 son sobre espacios columna C(A), y la ecuación Ax —b. 


21. Describa los espacios columna (rectas o planos) de estas matrices particulares: 



'1 

2 


"1 

0‘ 


'1 0' 

A = 

0 

0 

0 

0 

y B = 

0 

0 

2 

0 

y C = 

2 0 
0 0 


22. ¿Para qué miembros derechos (encuentre una condición sobre b u b 2 , b 3 ) los siguien¬ 
tes sistemas son resolubles? 


1 

4 

2 


V 


V 


1 

4 


Xl 

x 2 


V 

2 

8 

4 


x 2 

= 

b 2 

b ) 

2 

9 


- 

b 2 

-1 

-4 

-2 


* 3 . 


p3_ 


-1 

-4 



Pe 


23. Al sumar el renglón 1 de A al renglón 2 se obtiene B. Al sumar la columna 1 a la co¬ 
lumna 2 se obtiene C. Una combinación de las columnas de_también es una com¬ 

binación de las columnas de A. De las siguientes matrices, ¿cuáles tienen la misma 
columna_? 


A = 


1 

2 


2 

4 


y S = 


2 

6 


C = 


3 

6 


24. ¿Para qué vectores (b i, b 2 , b 3 ) los siguientes sistemas tienen una solución? 


'i 

i 

1" 


*1 


b¡ 


'i 

i 

r 


Xl 


b\ 

0 

i 

1 


x-i 

= 

b 2 

y 

0 

i 

i 


Xl 

= 

b 2 

0 

0 

1 


*3. 


p3_ 


0 

0 

0 


*3. 


p3_ 


25. (Recomendado) Si a una matriz A se suma una columna extra b, entonces el espacio co¬ 
lumna se vuelve más grande, a menos que_. Proporcione un ejemplo en el que el 

espacio columna se vuelva más grande, y un ejemplo en que no lo haga. ¿Por qué 
Ax = b es resoluble exactamente cuando el espacio columna no se vuelve más grande 
al incluir a b7 


26. Las columnas de A B son una combinación de las columnas de A. Esto significa: El 
espacio columna de A B está contenido en (y quizá es igual a) el espacio columna de 
A. Proporcione un'ejemplo en el que los espacios columna de A y AB no sean iguales. 

27. Si A es cualquier matriz invertible de 8 por 8 , entonces su espacio columna es —.—. 
¿Por qué? 

28. ¿Falso o verdadero? (proporcione un contraejemplo si es falso). 

a) Los vectores b que no están en el espacio columna C(A) constituyen un subespacio. 

b) Si C(A) contiene sólo al vector cero, entonces A es la matriz cero. 

c) El espacio columna de 2A es igual al espacio columna de A. 

d) El espacio columna de A — Ies igual al espacio columna de A. 
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29. Construya una matriz de 3 por 3 cuyo espacio columna contenga a ( 1 , 1, 0) y a (1, 0, 
1) pero no a (1, 1, 1). Construya una matriz de 3 por 3 cuyo espacio columna sea só¬ 
lo una recta. 

30. Si el sistema de 9 por 12 Ax = b es resoluble para toda b, entonces C(A) =_. 

31. ¿Por qué R 2 no es un subespacio de R 3 ? 


m 2.2 CÓMO RESOLVER Ax = 0 Y Ax = h 

El capítulo 1 se centró en matrices invertibles cuadradas. Había una solución de Ax = b, 
que era x = A~ x b. Esta solución se encontró por eliminación (y no calculando A“ l ). Una 
matriz rectangular trae nuevas posibilidades: U puede no tener un conjunto completo de pi¬ 
votes. Esta sección aborda el tema de ir de U a una forma reducida R: la matriz más sim¬ 
ple que puede obtenerse con eliminación. R revela de inmediato todas las soluciones. 

Para una matriz invertible, el espacio nulo sólo contiene a x = 0 (multiplicado Ax = 0 
por A -1 ). El espacio columna es todo el espacio (Ax — b no tiene solución para toda b). Las 
nuevas preguntas surgen cuando el espacio nulo contiene más que al vector cero y lo el es¬ 
pacio columna contiene menos que todos los vectores: 

1. Cualquier vector x„ en el espacio nulo puede sumarse a una solución particular x p . Las 
soluciones de todas las ecuaciones lineales tienen esta forma: x = x p + x„: 

Solución completa Ax p = b, y Ax — 0 producen A{x p + x„) = b. 

2. Cuando el espacio columna no contiene a toda b en R m , se requieren las condiciones 
sobre b para hacer resoluble a Ax — b. 

Un ejemplo de 3 por 4 es un tamaño aceptable. Se escribirán todas las soluciones de 
Ax = 0. Se encontrarán las condiciones para que b esté en el espacio columna (de modo 
que Ax = b sea resoluble). El sistema de 1 por 1 Ox = b, con una ecuación y una incógni¬ 
ta, presenta dos posibilidades: 


Ox = b no tiene soluciones a menos que b = 0. El espacio columna de la matriz cero de 
1 por 1 sólo contiene a b = 0 . 

Ox = 0 tiene una infinidad de soluciones. El espacio nulo contiene a toda x. Una solu¬ 
ción particular es x p — 0 , y la solución completa es x = x p + x n = 0 + (cualquier x). 

Admito que es sencillo. Si se pasa a una matriz de 2 por 2, la cuestión se vuelve más inte¬ 
resante. La matriz ^ no es invertible: y + z = b t y 2y + 2z = b 2 suele no tener 
solución. 

No hay solución a menos que b 2 = 2b ¡. El espacio columna de A sólo contiene bs 
que son múltiplos de ( 1 , 2 ). 

Cuando b 2 — 2 b lt hay una infinidad de soluciones. Una solución particular de 
y + z — 2 y 2y + 2z = 4 es x p = (1, 1). El espacio nulo de A en la figura 2.2 con¬ 
tiene a (— 1 , 1 ) y a todos sus múltiplos x„ = (— c, c ): 


Solución 

completa 


y + z = 2 
2y +2z = A 


es resuelto por x p + x n 


1 

1 


+ c 



1 — c 
1 4* c 
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todas las 


recta de 


todas las soluciones x — x p + x n 


[j — solución particular mas corta x p 

j^j _ solución particular MATLAB A b 


espacio nulo Ax n — 0\ _ , 

[i 1 y] = Í 2 1. 

Figura 2.2 Las rectas paralelas de soluciones de Ax n 0 y [ 2 2 [z J |_ 4 i 

Forma escalonada U y forma reducida por renglones R 

Se empieza por simplificar la matriz de 3 por 4, primero a U y luego a R: 

1 3 3 2 

Ejemplo básico A = 2 6 9- 

J -1-334 

™ , _ , „ diferente de cero Las operaciones elementales de costumbre produ- 

ÍES jo do U. ma.» »«id* .paree - la ~ 

lumna 2: n 

'13 3 2 

En la columna 2 no hay pivote A ° jj g \ ' 

El candidato a segundo pivote se volvió cero: esto es "aceptable^ Ab^o 

ca un elemento dtferente de cero, intentando realizar un mtercamb o Ene 

caso el elemento en cuestión también es cero. St A fiiese cuadrada, lo ^.tenor mdic q 

sssssssssír: 

cero, se llega a U: 


Matriz escalonada U U - 0 0 3 3j. 

Hablando estrictamente, se procede a la cuarta columna. En ^tercerapojión pivote hay 

do” o fonna escalonada. Para el caso de 5 por 8 en la figura 2.3, los elementos mdtcados 

con un asterisco pueden o no ser cero. • , , nivotes- 

Esta forma escalonada U, siempre puede obtenerse, con cero abajo de los ptvo . 

1 Los pivotes son los primeros elementos diferentes de cero en sus renglones. 

2. Abafo de cada pivote hay una columna de ceros, obtenida ^“ciom 

3. Cada pivote está a la derecha del pivote en el renglón de arriba. Esto produce p 
trón escalonado, y los renglones cero aparecen al ultimo. 
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'• 

* 

* 

* 

* 

* 

* 

* 


"1 

0 

* 

0 

* 

* 

* 

0 ' 

0 

# 

* 

* 

* 

* 

* 

* 


0 

1 

* 

0 

* 

* 

* 

0 

0 

0 

0 

m 

* 

* 

* 

* 

R = 

0 

0 

0 

1 

* 

* 

* 

0 

0 

0 

0 

0 

0 

0 

0 

• 


0 

0 

0 

0 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 _ 


0 

0 

0 

0 

0 

0 

0 

0 


Figura 2.3 Elementos de una matriz escalonada U de 5 por 8 y su forma reducida R. 


Debido a que se empezó con A y se terminó con U, seguramente el lector pregunta¬ 
rá: ¿Se tiene A = LU como antes? No hay razón para lo contrario, ya que los pasos de eli¬ 
minación no cambiaron. Cada paso sigue restando un múltiplo de un renglón de un renglón 
abajo de él. El inverso de cada paso, suma el múltiplo que fue restado. Estos inversos vie¬ 
nen en el orden correcto para colocar los multiplicadores directamente en L: 

'10 0 ' 

Triangular inferior ¿= 2 10 y A=LU. 

-1 2 1 


Observe que L es cuadrada. Tiene el mismo número de renglones que Ay U. 

La única operación que no es necesaria en nuestro ejemplo, aunque sí es necesaria en 
términos generales, es el intercambio de renglones por una matriz permutación P. Debido 
a que cuando no hay pivotes disponibles se prosigue con la siguiente columna, no es nece¬ 
sario suponer que A es no singular. A continuación se proporciona PA — LU para todas las 
matrices: 


2B Para cualquier matriz A de m por n existe una permutación P, una matriz trian¬ 
gular inferior L con diagonal unitaria, y una matriz {/ escalonada de m por n, tales 
que PA = LU. 


Ahora viene R. Es posible avanzar más que hasta U, con la finalidad de hacer aún 
más sencilla a la matriz. El segundo renglón se divide entre su pivote 3, de modo que to¬ 
dos los pivotes son 1. Luego, el renglón pivote se utiliza para obtener cero arriba del pi¬ 
vote. Esta vez, se resta un renglón de un renglón más arriba. El resultado final (la mejor 
forma que puede obtenerse) es la forma escalonada por renglones R: 


'1 3 3 2] [1 3 3 2] [1 3 0 -1' 

0 0 3 3 —» 0 0 11—» 001 1 = R. 

0 0 0 OJ [0 0 0 OJ [0 0 0 0 


La matriz R es el resultado final de la eliminación sobre A. MATLAB usa el comando R = 
rref(A). ¡Por supuesto, rref(/?) proporciona nuevamente i?! 

¿Cuál es la forma reducida por renglones de una matriz invertible cuadrada? En este 
caso R es la matriz identidad. Hay un conjunto completo de pivotes, todos iguales a 1, con 
ceros arriba y abajo. Así, rref(A) = I, cuando A es invertible. 

Para una matriz de 5 por 8 con cuatro pivotes, en la figura 2.3 se muestra la forma re¬ 
ducida R. Sigue conteniendo una matriz identidad en los cuatro renglones pivote, y en 
las cuatro columnas pivote. A partir de R rápidamente se encuentra el espacio nulo de A. 
Rjc = 0 tiene las mismas soluciones que Ux = 0 y Ax = 0. 
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Variables pivote y variables libres 

Nuestra meta es leer todas las soluciones de Rx = 0. Los pivotes son cruciales: 

Espacio nulo de R 13 0—1 U 0 

(las columnas pivote &= 0 0 1 1 = 0 . 

están en negritas) 0 0 0 0 |_0_ 

Las incógnitas u, v, w, y se presentan por grupos. Un grupo contiene las variables pivote, 
las que corresponden a las columnas con pivotes. Las columnas primera y tercera contie¬ 
nen a los pivotes, de modo que «y» son las variables pivote. El otro grupo está integra¬ 
do por las variables libres, que corresponden a las columnas sin pivotes. Éstas son las 
columnas segunda y cuarta, por lo que las variables libres son v y y. 

Para encontrar la solución más general de Rx = 0 (o, de manera equivalente, de Ax = 
0), es posible asignar valores arbitrarios a las variables libres. Suponga que estos valores se 
denominan simplemente vy y. Las variables pivote están determinadas completamente en 
términos de v y y: 

K =n u + 3v - y - 0 produce u = —3v + y 

w + y= 0 produce w = —y (1) 

Hay un “doble infinito” de soluciones, con vy y libres e independientes. La solución com¬ 
pleta es una combinación de dos soluciones especiales: 


El espacio nulo contiene a 
todas las combinaciones de 
las soluciones especiales 



Por favor, observe nuevamente esta solución completa de Rx = 0 y Ax = 0. La solución 
especial (-3, 1, 0, 0) tiene a las variables libres v = 1, y y = 0. Las variables libres de la 
otra solución especial (1,0, —1, 1) son v = 0, y y = 1. Todas las soluciones son combina - 
dones lineales de estas dos soluciones. La mejor forma de encontrar todas las soluciones 
de Ax = 0 es a partir de las soluciones especiales: 

1. Después de llegar a Rx = 0, identificar las variables pivote, y las variables libres. 

2. Asignar a una variable libre el valor 1, igualar a cero las demás variables libres, y re¬ 
solver Rx = 0 para las variables pivote. Esta * es una solución especial. 

3. Cada variable Ubre produce su propia "solución especial” por el paso 2. Las combina¬ 
ciones de las soluciones especiales constituyen el espacio nulo: todas las soluciones 
de Ax — 0. 


Dentro del espacio tetradimensional de todos los vectores posibles x, las soluciones de 
Ax = 0 constituyen un subespacio bidimensional: el espacio nulo de A. En el ejemplo, 
N(A) es generado por los vectores especiales (—3, 1, 0, 0) y (1, 0, —1, 1). Las combinacio¬ 
nes de estos dos vectores producen todo el espacio nulo. 

Aquí hay un pequeño truco. Las soluciones especiales son especialmente fáciles a 
partir de R. Los números 3y0y—lyl están en las “columnas no pivote” de R. Para 
encontrar las variables pivote (no las libres), invierta sus signos en las soluciones es¬ 
peciales, Escribiré las dos soluciones especiales de la ecuación (2) en una matriz N, de 
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espacio nulo, para que el lector vea el patrón claro: 

Matriz del espacio nulo 
(las columnas son soluciones especiales) 

Los valores de las variables libres son 1 y 0. Cuando las columnas libres se movieron al 
miembro derecho de la ecuación ( 2 ), sus coeficientes de3y0y — lyl cambiaron de sig¬ 
no. Esto determinó las variables pivote en las soluciones especiales (las columnas de N). 

Este es el momento de reconocer un teorema extremadamente importante. Suponga 
que una matriz tiene más columnas que renglones, n> m. Debido a que m renglones pue¬ 
den aceptar cuando mucho a m pivotes, por lo menos debe haber n —m variables libres. 
Hay aún más variables libres si algunos renglones de R se reducen a cero; pero no impor¬ 
ta el caso: por lo menos una variable debe ser libre. A esta variable libre puede asignarse 
cualquier valor, lo cual lleva a la siguiente conclusión: 




ZC Si Ax = 0 tiene más incógr 
solución especial: hay más solu 


ia trivial x = 0 . 


Debe haber una infinidad de soluciones, ya que cualquier múltiplo ex también satisfa¬ 
ce Aicx ) = 0. El espacio nulo contiene a la recta que pasa por x. Y si hay variables libres 
adicionales, el espacio nulo se convierte en más que justo una recta en el espacio «-dimen¬ 
sional. El espacio nulo tiene la misma "dimensión" que el número de variables libres, y 
las soluciones especiales. 

La idea central: la dimensión de un subespacio, se precisará en la siguiente sección. 
Para el espacio nulo se cuentan las variables libres. ¡Para el espacio columna se cuentan las 
variables pivote! 


Cómo resolver Ax — b,Ux — cyRx = d 

El caso b * 0 es bastante distinto al caso b = 0. Las operaciones en los renglones sobre A 
también deben actuar sobre el miembro derecho (en b). Se empieza con las letras (¿q, b 2 , 
b 3 ) para encontrar la condición de solubilidad para que b esté en el espacio columna. Lue¬ 
go se escoge b = ( 1 , 5 , 5 ) y se encuentran todas las soluciones x. 

Para el ejemplo original Ax = b = (¿q, b 2 , b 3 ), a ambos lados se aplican las operacio¬ 
nes que llevaron de A a U. El resultado es un sistema triangular superior Ux = c: 

'1 3 3 21 “ [ bi 

Ux = c 0 0 3 3 = b 2 - 2bi . (3) 

0 0 0 0 b 3 - lb 2 + 5¿q_ 

El vector c en el miembro derecho, que aparecía después de los pasos de eliminación ha¬ 
cia adelante, es justo L~ l b, como en el capítulo previo. Ahora se inicia con Ux = c. 

No resulta evidente que estas ecuaciones tengan una solución. La tercera ecuación pre¬ 
senta serias dudas, ya que su miembro izquierdo es cero. Las ecuaciones son inconsisten¬ 
tes a menos que b 3 -2 b 2 + 5b x = 0. Aunque haya más incógnitas que ecuaciones, puede 
no haber solución. Conocemos otra forma para contestar la misma pregunta: Ax = b pue¬ 
de resolverse si y sólo si b está en el espacio columna de A. Este subespacio proviene de 
las cuatro columnas de A (¡no de £/!): 
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Las columnas de A l" 3 3 2 

“generan” el 2 , 6 , 9 , 7 . 

espacio columna —1 —3 3 4 

Aunque hay cuatro vectores, sus combinaciones sólo llenan un plano en el espacio tridimen¬ 
sional. La columna 2 es tres veces la columna 1 . La cuarta columna es igual a la tercera me¬ 
nos la primera. Estas columnas dependientes, la segunda y la cuarta, son exactamente las 
que carecen de pivotes. 

El espacio columna C(A) puede describirse en dos formas distintas. Por una parte, es 
el plano generado por las columnas 1 y 3. Las otras columnas están en ese plano, y no con¬ 
tribuyen con nada nuevo. De manera equivalente, es el plano de todos los vectores b que 
cumplen b 3 — 2b 2 + 5b x = 0; esta es la restricción si el sistema ha de ser resoluble. ¡To¬ 
da columna satisface esta restricción, de modo que está forzada sobre b! Geométrica¬ 
mente, se verá que el vector (5, —2, 1) es perpendicular a cada columna. 

Si b pertenece al espacio columna, las soluciones de Ax — b son fáciles de encontrar. 
La última ecuación en Ux = c es 0 = 0. A las variables libres v y y, es posible asignarles 
valores cualesquiera, como antes. Las variables pivote u y w siguen determinándose por 
sustitución hacia atrás. Para un ejemplo específico con b 3 — 2b 2 + 5íq = 0, se escoge 
h = (1, 5, 5): 


13 3 2 
2 6 9 7 

-1-3 3 4 


= 5 . 
5 


La eliminación hacia adelante produce U a la izquierda y c a la derecha: 


Ux — c 


13 3 2 
0 0 3 3 
0 0 0 0 


La última ecuación es 0 = 0, como era de esperarse. La sustitución hacia atrás proporciona 


3tü + 3y = 3 
u + 3v + 3w + 2y = 1 


w = 1 — y 

li — —2 — 3 v + y. 


De nuevo, hay una infinidad de soluciones: v y y son libres; u y w no lo son: 

• • M f-2] [-3] [ f 

Solución completa u 0 1 0 

' , X — = , + V „ + V ,• (4) 

X = x p + x n w 1 0 J — 1 

¿ L oj L °J ! . 

Lo anterior contiene todas las soluciones de Ax = 0, más la nueva x p = (—2, 0, 1, 0). Es¬ 
ta x, es una solución particular de Ax — b. Los dos últimos términos con v y y producen 
más soluciones (ya que cumplen Ax = 0). Toda solución de Ax = b es la suma de una so¬ 
lución particular, y una solución de Ax = 0: 


•^particular ‘ -^espado nulo 




das las variables libres iguales a cero. Esta es la única parte nueva, porque el espacio nu¬ 
lo ya estaba calculado. Cuando la ecuación en el recuadro se multiplica por A, se obtiene 

Ax cor npíeta b 0. 

Geométricamente, las soluciones llenan de nuevo una superficie bidimensional, pero 
no es un subespacio. No contiene a x = 0. Es paralelo al espacio nulo que se tenía ante¬ 
riormente, desplazado por una solución particular x p , como se muestra en la figura 2.2. La 
ecuación (4) es una forma aceptable de escribir la respuesta: 

1. Reducir Ax = b & Ux = c. 

2. Con las variables libres = 0, encontrar una solución particular de Ax p = b y Ux p = c. 

3. Encontrar las soluciones especiales de Ax = 0 (o de Ux = 0 o de Rx — 0). Cada varia¬ 
ble libre, a su vez, es 1. Así, x = x p + (cualquier combinación x„ de soluciones 
especiales). 

Cuando la ecuación era Ax = 0, ¡la solución particular era el vector cero! Esto se ajusta al 
patrón, aunque x particu!ar = 0 no se escribió en la ecuación (2). Ahora x p se sumó a las so¬ 
luciones del espacio nulo, como en la ecuación (4). 

Pregunta: ¿cómo la forma reducida R hace aún más clara esta solución? Se verá en el 
ejemplo. La ecuación 2 se resta de la ecuación 1, y luego la ecuación 2 se divide entre su 
pivote. En el miembro izquierdo, esto produce R, como antes. En el miembro derecho, es¬ 
tas operaciones cambian c = (1, 3, 0) a un nuevo vector d = (—2, 1, 0): 


Ecuación reducida 
Rx = d 


La solución particular x p (una de muchas opciones) tiene las variables libres v = y = 0. 
Las columnas 2 y 4 pueden ignorarse. Luego, de inmediato se tiene u = —2yw= 1, exac¬ 
tamente como en la ecuación (4). Los elementos de d van directamente hacia x p . ¡Esto 
se debe a que la matriz identidad se encuentra en las columnas pivote de R! 

A continuación se resumirá esta sección, antes de presentar otro ejemplo. La elimina¬ 
ción revela las variables pivote y las variables libres. Si hay r pivotes, entonces hay r va¬ 
riables pivote, y n — r variables libres. A este número importante r se asigna un nombre: 
se trata del rango de la matriz. 


2D Suponga que la eliminación reduce Ax = b aUx = c y Rx — d, con r renglones 
pivote, y r columnas pivote. El rango de estas matrices es r. Los últimos m — r ren¬ 
glones de U y R son cero, de modo que hay una solución sólo si los últimos 
m — r elementos de c y d también son cero. 

La solución completa es x = x p + x„. Una solución particular x p tiene iguales a ce¬ 
ro a todas las variables libres. Sus variables pivote son los primeros r elementos de 
d, por lo cual Rx p = d. 

T no rf ol v cnn t'rvmKtncir'tnnpc rio w? — tr PCT'tP’r't 


Las soluciones del espacio nulo x„ son combinaciones 
les, con una variable libre igual a 1. Las variables pivc 


:e en esa 


s especia- 
especial. 


pueden encontrarse en la columna correspondiente de R (con signo invertido). 

Ahora el lector puede ver cómo es crucial el rango r. Éste cuenta los renglones pivote en 


n 
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Otro ejemplo desarrollado 

La representación completa utiliza eliminación, y columnas pivote para encontrar el espa¬ 
cio columna, el espacio nulo y el rango. La matriz A de 3 por 4, tiene rango 2: 

Ixi + 2x2 + 3x3 + 5x4 = b\ 

Ax — b es 2xi + 4 x 2 + 8 x 3 + 12 x 4 = ¿2 ( 6 ) 

3xi + 6x2 + 7X3 4" 13X4 = í>3 

1. Reducir [A b] a [U c], para llegar a un sistema triangular Ux = c. 

2. Encontrar la condición sobre b ít b 2 , *3 para tener una^solución. 

3. Describir el espacio columna de A: ¿Cuál plano en R ? ^ 

4. Describir el espacio nulo de A: ¿Cuáles soluciones especiales en R ■ 

5. Encontrar una solución particular de Ax = (0, 6 , - 6 ) y la solución completa x p + x„. 

6 . Reducir [U c ] a [R d]: soluciones especiales de R y x p de d. 

Solución (¡Observe cómo el miembro derecho se incluye como una columna adicional!) 

1. Los multiplicadores en la eliminación son 2 y 3 y -1, tomando [A b] a [í/ c]. 

ri 2 3 5 ¿i] ri 2 3 5 ¿.i 1 F 1 2 3 5 * 

2 4 8 12 b-, 0 0 2 2 - 2*i 0 0 2 2 fe - 2*i . 

3 6 7 13 * 3 J [O 0 -2 -2 *3 - 3*iJ |0 0 0 0 *3 + *2 ~ S*iJ 

2. La última ecuación muestra la condición de solubilidad b 3 + b 2 - 5*j = 0. Así, 0 = 0. 

3. El espacio columna de A es el plano que contiene a todas las combinaciones de las co¬ 
lumnas pivote (1, 2, 3) y (3, 8, 7). Segunda descripción: El espacio columna contie¬ 
ne a todos los vectores con b 3 + b 2 — 5*i = 0. Esto hace resoluble a Ax — b, de mo o 
que b está en el espacio columna. Todas las columnas de A pasan esta prueba b 3 + 
b 2 - 5*! = 0. Esta es la ecuación del plano (en la primera descripción del espacio 

columna ). _ _ _ _ 

4. Las soluciones especiales en N tienen las variables libres x 2 — 1, x 4 — 0 y x 2 > 

x 4 = 1: 


Matriz dei espacio nulo “2 —2 

Soluciones especiales de Ax = 0 ^ _ 1 0 

Sustitución hacia atrás en l/x = 0 0—1 

Simplemente cambia signos en Rx = 0 L ® . 

5. Se elige b = (0, 6 , - 6 ), que tiene b 3 + b 2 - 5b, = 0. La eliminación lleva Ax = b a 
Ux = c = (0, 6 , 0). Se sustituye hacia atrás con las variables libres - 0: 

' —9 

_ 0 es libre 

Solución particular de Ax p = (0, 6 ,- 6 ) x p — 3 

0 es libre 

La solución completa de Ax = (0, 6 , — 6 ) es (esta x p ) + todas las x n ). 

6 , En la R reducida, la tercera columna cambia de (3, 2, 0) a (0, 1, 0). El miembro dere¬ 
cho c = (0, ó, 0) se convierte en d = (—9, 3, 0). Así, —9 y 3 van hacia x p . 


Se elige b 


[R d] 


'1 

2 

3 

5 

0 ‘ 

0 

0 

2 

2 

6 

0 

0 

0 

0 

0 _ 


1 

2 

0 

2 

— 9 

0 

0 

1 

1 

3 

0 

0 

0 

0 

0 


2.2 Cómo resolver Ají = 0 y Ax = b 
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Esa matriz final [J? d] es rref( [A *]) = rref( [U c]). Los números 2 y 0 y 2 y 1 en las 
columnas libres de R tienen signo opuesto en las soluciones especiales (la matriz espacio 
nulo N).Rx = d, revela todo. 

Conjunto de problemas 2.2 

1. Construya un sistema con más incógnitas que ecuaciones, pero sin solución. Cambie 
el miembro derecho a cero, y encuentre todas las soluciones x n . 

2. Reduzca Ay B a forma escalonada para encontrar sus rangos. ¿Qué variables son li¬ 
bres? 


"1 

2 

0 

f 

fl 

2 

3' 

0 

1 

1 

0 

B = 4 

5 

6 

1 

2 

0 

1 

7 

8 

9 


Encuentre las soluciones especiales de Ax = 0 y Bx = 0. Encuentre todas las solucio¬ 
nes. 

Encuentre la forma escalonada de U, las variables libres, y las soluciones especiales: 

r° 1 ° 3] r*,] 

A 0 2 0 6 ’ P * 2 ‘ 


Ax = * es consistente (tiene una solución) cuando b satisface b 2 
la solución completa en la misma forma que la ecuación (4). 


_. Encuentre 


4. Efectúe los mismos pasos que en el problema previo para encontrar la solución com¬ 
pleta de Mx = b: 


00 ’ *3 ' 

3 6J [ b *. 

Escriba las soluciones completas x = x p + x„ de estos sistemas, como en la ecuación 
(4): 

‘i 2 2] [“ = [1] [1 2 2] “ = |Y 

2 4 5 v 4 2 4 4 v 4 ' 

1 J |_u>J L J L J |_tuj L 

Describa el conjunto de miembros derechos b obtenibles (en el espacio columna) para 


al encontrar las restricciones sobre b que hacen que la tercera ecuación sea 0 = 0 (des¬ 
pués de la eliminación). ¿Cuál es el rango, y una solución particular? 

Encuentre el valor de c que hace posible resolver Ax = b, y resuélvalo: 

u + v + 2w = 2 
2u + 3v — w = 5 


3u + 4v + w = c. 
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8 . ¿Cuáles deben ser las condiciones sobre fe, y (en caso de haber alguna) para que 
Ax — b tenga solución? 

Í 1 2 0 3] , = [M 

A - ¡2 4 0 7J’ L^J 

Encuentre dos vectora en el especio nulo de A, asi como la solucidn completa de 

Ax = b. . 

9. a) Encuentre las soluciones especiales de Ux = 0. Reduzca U a R, y repita lo ante- 


'12 3 4 
0 0 12 
0 0 0 0 


. • Aa (ñ n m a (a b 0 ) ¡ cuáles son todas las solu- 
b) Si el miembro derecho se cambia de (0, 0, ) ( > > ’ 

ciones? 

10. Encuentre un sistema Ax = b de 2 por 3 cuya solución completa es 

_ _ t~. -i 


2 4- w 3 


Encuentre un sistema de 3 por 3 con es» soluciones etotcBmente cuando 6, + h 

K • , • e 

a _ uAf .0 nor 2 con muchas soluciones x„, pero sm solución x p . 

12. ¿Cuáles de las siguiente, reglas proporcionan un. definición correen, del rango de A3 

d) El número de renglones diferentes de cero en R. 

b) El número de columnas menos el número total de renglón. 

c) El número de columnas menos el número de columnas libres. 

d ) El número de ls en R. 

13. Encuentre las formas escalonadas reducidas por renglón R, y el rango de las siguien¬ 
tes matrices: 

a) La matriz de 3 por 4 de todos los ls.^ 

b) La matriz de 4 por 4 con a¡j = ( — 1) • 

c) La matriz de 3 por 4 con a u = (~ l) 7 - 

14. Encuentre R para cada una de las siguientes matrices (en bloque), así como las so u- 
ciones especiales: 


[0 0 0 

0 0 3 

2 4 6 


B = [A A] 


15. Si primero aparecen las r primeras variables pivote, entonces la R reducida debe ver- 


wuiv 

7 F] I es de r por r 
R = o 0J Fes de rporn - r 

¿Cuál es la matriz espacio nulo N que contiene las soluciones especiales ? 


2.2 Cómo resolver Ax = Q y Ai = b 
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16. 

17. 

18. 

19. 

20 . 

21 . 

22 . 

23. 

24. 

25. 

26. 

27. 

28. 


Suponga que todas las r variables pivote aparecen al último. Describa los cuatro blo¬ 
ques en la forma escalonada reducida de m por n (el bloque B debe ser de r por r): 




¿Cuál es la matriz espacio nulo N de las soluciones especiales? ¿Cuál es su forma? 
(Problema tonto) Describa todas las matrices A t y A 2 de 2 por 3 con formas escalona¬ 
das por renglones R t y R 2 , tales que R t + R z es la forma escalonada por renglones de 
Aj + A 2 - ¿Es cierto que R¡ — A t y R 2 = A 2 en este caso? 

Si A tiene r columnas pivote, entonces A T tiene r columnas pivote. Proporcione un 
ejemplo de 3 por 3 para el que los números de columna son distintos para A y A T . 

¿Cuáles son las soluciones especiales de Rx = 0 y R T y = 0 para las siguientes /?? 


'1 

0 

2 

3" 

0 

1 

2 

R = 0 

1 

4 

5 

R — 0 

0 

0 

0 

0 

0 

0 

0 

0 

0 


Si el rango de A es r, entonces tiene una submatriz S de r por r que es invertible. En¬ 
cuentre esa submatriz 5 a partir de los renglones pivote, y las columnas pivote para ca- 


1 2 3 

1 2 4 


1 2 3 

2 4 6 


0 1 0 
A = 0 0 0 

0 0 1 


Explique por qué los renglones pivote y las columnas pivote de A (no R) siempre pro¬ 
porcionan una submatriz invertible de A de r por r. 

Encuentre los rangos de AB y AM (matriz de rango 1 multiplicada por una matriz de 
rango 1 ): 



y 



1 

1.5 




Al multiplicar las matrices de rango 1 A = uv r y B = wz r se obtiene uz T multiplica¬ 
da por el número_. El rango de AB es 1 a menos que_= 0. 

Toda columna de AB es una combinación de las columnas de A. Así, las dimensiones 
de los espacios columna proporcionan rangoíAB) £ rango(A). Problema: También 
demuestre que rango(AB) £ rango(B). 

(Importante) Suponga que A y B son matrices de n por n, y que AB = I.A partir de ran¬ 
goíAB) £ rango(A), demuestre que el rango de A es n. Así, A es invertible, y B debe ser 
su inversa por ambos lados. En consecuencia, BA = I (¡lo cual no es tan evidente !). 

Si A es de 2 por 3 y C es de 3 por 2, a partir de su rango demuestre que CA =£ /. Pro¬ 
porcione un ejemplo en el que AC = I. Para m<n , una inversa derecha no es una in¬ 
versa izquierda. 

Suponga que Ay B tienen la misma forma escalonada reducida por renglones R. Ex¬ 
plique cómo cambiar de A a B, mediante operaciones elementales en los renglones. 
Así, B es igual a una matriz_multiplicada por A. 

Toda matriz de m por n de rango r se reduce a ( m por r) multiplicada por (r por n ): 

A — (columnas pivote de Á)(r primeros renglones de R) = (COL)(ItENGLON). 
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Escriba la matriz de 3 por 4 A, al inicio de esta sección, como ^producto de la ma¬ 
triz de 3 por 2 a partir de las columnas pivote, y la matriz de 2 p • 


2» Suponga que A es una matriz <te m por n de mngo r. Su forma escalonada »***>•“ 
* exactamente la/»™ escalónate reducida por realces de R (no A ). 

30. (Recomendado) Ejecute los seis pasos esj topués tte R. (6) para en¬ 

contrar el espacio columna, y el espacio nulo de A y la soluoton de 

r- _ 1 r A 


31. Para cada c, encuentre R, y las soluciones especiales de Ax - 0: 


32. ¿Cuál es la matriz espacio nulo N (de soluciones especiales) para A, B, C? 

a-[/ f] y *-[¿ ó] * c ‘ [ ' ' ' l 

Los problemas 33 a 36 son sobre la solución de Ax = b. Siga los pasos proporciona¬ 
dos en el texto para encontrar x p y Reduzca la matnz aumentada [ ]. 

33. Encuentre las soluciones completas de 

2x+|+| = 5 y ¿ 6 4 8 ^ = 3. 

cumple esa condición: 

x 4- 2y - 2z = b x 
2x 4- 5 y 4z = 

4x 4- 9y — 8 z = & 3 - 

35. ¿Cuáles son las condiciones sobre b x , b 2 , b 3 , b, para que cada uno de los siguientes sis¬ 
temas sea resoluble? Despeje x: 

-i ri_ i 


¿Cuáles vectores (fe„ b 2 , b 3 ) están en el espacio columna de A? ¿Cuáles combinacio¬ 
nes de los renglones de A proporcionan cero? 


2.2 Cómo resolver Ax = 0 y Ax — b 
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37. 

38. 

39. 

40. 

41. 

42. 

43. 

44. 

45. 

46. 


¿Por qué no es posible que un sistema de 1 por 3 tenga x p = (2, 4, 0) y x n = cualquier 
múltiplo de ( 1 , 1 , 1 )? 

a) Si Ax — b tiene dos soluciones x x y x 2 , encuentre dos soluciones de Ax = 0. 

b) Luego, encuentre otra solución de Ax = b. 

Explique por qué las siguientes afirmaciones son falsas: 

a) La solución completa es cualquier combinación lineal de x p y x n . 

¿>) Un sistema Ax = b tiene cuando mucho una solución particular. 

c) La solución x p con todas las variables libres iguales a cero es la solución más bre¬ 
ve (longitud mínima ||x||). (Encuentre un contraejemplo de 2 por 2). 

d) Si A es invertible, entonces no hay solución x„ en el espacio nulo. 

Suponga que la columna 5 de U no tiene pivote. Entonces x 5 es una variable_. El 

vector cero (es) (no es) la única solución de Ax = 0. Si Ax = b tiene una solución, en¬ 
tonces tiene_soluciones. 

Si se conocen x p (variables libres = 0) y todas las soluciones especiales de Ax = b, 
encuentre x„ y todas las soluciones especiales para los siguientes sistemas: 

Ax = 2b [A 4 x ~ b A M = b ' 


Si Ax = b tiene una infinidad de soluciones, ¿por qué es imposible que Ax = B (nue¬ 
vo miembro derecho) tenga una sola solución? ¿Es posible que Ax = B no tenga so¬ 
lución? 

Escoja el número q de modo que (de ser posible) los rangos sean a) 1, b) 2, c) 3: 


' 6 

4 

2 

„ 3 

i 

3' 

-3 

9 

-2 

6 

-1 y 

<?. 

B = 

q 

2 

q. 


Proporcione ejemplos de matrices A para las cuales el número de soluciones de Ax = 
b sea 

a) 0 o 1 , dependiendo de b. 

b) oo, sin importar b. 

c) 0 o oo, dependiendo de b. 

d) 1, sin importar b. 

Escriba todas las relaciones conocidas entre rymynsiAx = b 

a) No tiene solución para alguna b. 

b) Tiene una infinidad de soluciones para toda b. 

c) Tiene exactamente una solución para alguna b, y ninguna solución para otra b. 

d) Tiene exactamente una solución para toda b. 

Aplique la eliminación de Gauss-Jordan (el miembro derecho se convierte en una co¬ 
lumna extra) a Ux - 0 y Ux = c. Obtenga Rx = 0 y Rx = d: 


r -1 [1 2 3 0] r rT -I 

i U °] = [o 0 4 oj y C ] 


'12 3 5 

0 0 4 8 ' 


Resuelva Rx = 0 para encontrar x n (su variable libre es x 2 — 1). Resuelva Rx — d pa¬ 
ra encontrar x p (su variable libre es x 2 — 0 ). 
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47. Aplique eliminación con la columna extra para obtener Rx-OyR*' 


'3 0 6 0 ' 
0 0 2 0 
0 0 0 0 


'3 0 6 9' 
0 0 2 4 
0 0 0 5 


Resuelva Rv - 0 (atable Ubre - i). ¿Cuáles son te soluciones d 'Rx-S! 

48. Reduzca lo siguiente a Ux = c (eliminación gaussiana), y lue o 0 a 

"1 o 2 31 H [ 2 1 

Ax = 1 3 2 0 — 5 

2 0 4 9 3 L 10 J 

L J A4 

Encuentre un, solución pariente u, y todas te soluciones t, del espacio nulo. 

49. Encuende A y B con la propiedad mencionada, o bien, esplique po, que no es postble. 


a) La única solución de Ax - 2 es x 


b) La única solución de Bx = [°jesx - 2 j • 

50. La solución completa de Ax = [3] es * = [ 0 ] + C [ ! ]‘ Encuentre A 

51. El espacio nulo de una matriz A de 3 por 4 es la recta que pasa por (2, 3. 1, 0). 

a) ¿Cuál es el rango de A y la solución completa de Ax - 0? 

b) ¿Cuál es la forma escalonada reducida exacta por renglones R de A. 

52. Reduzca las siguientes matrices A y B a sus formas escalonadas ordinarias U: 


■ 1 

2 

2 

4 

6l 

*2 

4 

2 

1 

2 

3 

6 

9 

tí) B = 0 

4 

4 

.0 

0 

1 

2 

3 

1° 

8 

8 


Fncuentre una solución especial para cada variable Ubre, y describa cada solución de 
a Reduzca las fomras escalonadas U a R, y destaque con un recuadro 
los renglones pivote y las columnas pivote de la matnz identidad. 

53. ¿Falso o verdadero? (En caso de ser cierto, proporcione una razón, o un contraejem¬ 
plo si es falso.) 

a) Una matriz cuadrada no tiene variables libres. 

b) Una matriz invertible no tiene variables libres. 

c) Una matriz de m por n no tiene más de n variables pivote. 

d) Una matriz de m por n no tiene más de m variables pivote. 

54. ¿Existe una matriz de 3 por 3 sin elementos cero para la cual U = R = P. 

55. Escriba tantos ls como pueda en una matriz escalonada U de 4 por 7, y en una forma 
reducida R cuyas columnas pivote sean 2, 4, 5. 

56. Suponga que 1, columna 4 de una matriz de 3 por 5 es toda igual« 

ciertamente una variable _. La solución especial para esta venable es 

X = _ _• 


2.2 Cómo resolver Ax = 0 yAx = b 


ferentes de cero). Entonces__ es una variable libre. Encuentre las soluciones espe¬ 

ciales para esa variable. 

58. La ecuación x - 3y - z = 0 determina un piano en R 3 . ¿Cuál es la matriz A en esta 
ecuación? ¿Cuáles son las variables libres? Las soluciones especiales son (3, 1, 0) y 

_. El plano paralelo x — 3y — z = 12 contiene al punto particular (12, 0, 0). Todos 

los puntos en este plano tienen la forma siguiente (escriba las primeras componentes): 




+ z 



59. Suponga que columna 1 + columna 3 + columna 5 = 0 en una matriz de 4 por 5 con 
cuatro pivotes. ¿Cuál columna carece seguramente de pivote? (¿Y cuál es la variable 
libre?) ¿Cuál es la solución especial? ¿Cuál es el espacio nulo? 

En los problemas 60 a 66 se solicitan matrices (de ser posible) con ciertas propiedades. 

60. Construya una matriz cuyo espacio nulo conste de todas las combinaciones de (2, 2, 
1,0) y (3, 1,0, 1). 

61. Construya una matriz cuyo espacio nulo conste de todos los múltiplos de (4, 3, 2, 1). 

62. Construya una matriz cuyo espacio columna contenga a (1, 1, 5) y a (0, 3, 1), y cuyo 
espacio nulo contenga a (1, 1,2). 

63. Construya una matriz cuyo espacio columna contenga a (1, 1, 0) y a (0, 1, 1), y cuyo 
espacio nulo contenga a (1, 0, 1) y a (0, 0, 1). 

64. Construya una matriz cuyo espacio columna contenga a (1, 1, 1) y cuyo espacio nulo 
es la recta de múltiplos de (1, 1, 1, 1). 

65. Construya una matriz de 2 por 2 cuyo espacio nulo sea igual a su espacio columna. 

66. ¿Por qué ninguna matriz de 3 por 3 tiene un espacio nulo igual a su espacio columna? 

67. La forma reducida R de una matriz de 3 por 3 con elementos elegidos aleatoriamente 

casi seguramente es_. ¿Cuál R es virtualmente cierta si la matriz aleatoria A es de 

4 por 3? 

68 . Demuestre con un ejemplo que las tres siguientes afirmaciones suelen ser falsas'. 

a) A y A t tienen el mismo espacio nulo. 

b) A y A t tienen las mismas variables libres. 

c) Si R es la forma reducida de rref(A), entonces R T es rref(A T ). 

69. Si las soluciones especiales de Rx = 0 están en las columnas de estas N, vuelva hacia 
atrás para encontrar los renglones diferentes de cero de las matrices reducidas R: 


2 3" 
1 0 
0 1 




(matriz vacía de 3 por 1). 
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2,3 INDEPENDENCIA LINEAL, BASE Y DIMENSIÓN 


Por sí mismos, los números « y » proporcionan una repres e ~^ompto del 
dero tamaño de un sistema lineal. La matnz de nuestro ejemplo tema^^Xs Seros 
tro columnas, aunque el tercer renglón era solo 

nesnués de la eliminación se convirtió en un renglón cero. No alecto el prooiema n 
oéneo Ax = 0. Las cuatro columnas también fracasaron en cuanto a ser independien , y 

el espacio columna degeneró en un plano bidimensional verdadero) es el rango 

F1 número importante que está comenzando a surgir (el tamaño verdadero) es ei rang 

r El rLToTeTntxTdujo como el número de pivotes en el proceso de eliminación. De mane- 
TSz final U tiene r renglón,, dife»,., de cero. Esta “»”»“'=; 
ra podido proporcionarse a una computadora, aunque «ría erróneo dejarla ahí, porque 
P see un significado simple e intuitivo: El rango cuenta el numero de renglones g - 
S ZT^es en l ó. Lo que se boa., son defmicio.es matemáticas, 

más que computacionales. 

El objetivo de esta sección es explicar y usar cuatro conceptos. 

1. Independencia o dependencia lineal. 

2. Generación de un subespacio. 

3. Base de un subespacio (un conjunto de vectores). 

4. Dimensión de un subespacio (un número). 

El primer paso es definir independencia lineal. Dado un conjunto de vectores v b • • •. 
„„ se teclsus combinaciones c,„ + c„ 2 + • • ■ + Ce Latcombinacrdu^mtd.l.cob 
todos los pesos c- = o, evidentemente produce el vector cero: Ou, + • • • + 0v k U. La 
es i, ün¡eafonne d. producir cero. E» «o ftanadvo. los vectores son 

“ de ^“^quier ob. combin.ctd» de los vectores se obtiene cero, entonces son de- 
pendientes. 

2E Suponga que Cjiq + • • ■ + c k v k = 0 sólo ocurre cuando c¡ - ' ~ c * 

tonces los vectores „„ ..., v k son linealmente independientes. Si algunas es son di- 
ferentes de cero, las vs son linealmente dependientes. Un vector es una combinación 

de los demás. ' 

La dependencia lineal es fácil de visualizar en el espacio tridimensional, cuando todos 
los vectores salen del origen. Dos vectores son dependientes si están en la misma recta. Tres 
Z^Z Zendienis s, es, d, « d mii™, plañe. Un. elección ..«atona de be, vem 
lores, sin ningún accidente especial, debe producir independencia lineal (no están en un 
plano). Cuatro vectores siempre son linealmente dependientes en K . 


Ejemplo 1 
Ejemplo 2 


Si Vl = vector cero, entonces el conjunto es linealmente dependiente. Puede elegirse c t 
3 y todas las demás c, = 0; esta es una combinación no trivial que produce cero. 

Las columnas de la matriz 

' 1 3 3 2" 

A = 2 6 9 5 

—! -3 3 0 


son linealmente dependientes, ya que la segunda columna es tres veces la P™aXa com¬ 
binación de las columnas con pesos -3, 1, 0, 0 proporciona una columna de ceros. 


glón 2 menos cinco veces el renglón 1. (Esto es lo mismo que la combinación de b u b 2 , b 3 , 
que tuvo que desaparecerse en el miembro derecho para que Ax = b fuera consistente. A 
menos que b 3 —2 b 2 + 5b x = 0, la tercera ecuación no se convierte en 0 = 0). 

Ejemplo 3 Las columnas de la siguiente matriz triangular son linealmente independientes : 


No hay ceros en la diagonal 


Se busca una combinación de las columnas que produzca cero: 

"3l [4] [2] fO- 

Se resuelve Ac — 0 c x 0 + c 2 1 + c 3 5 = 0 . 

oj |oJ L 2 J L°- 

Hay que demostrar que c x , c^, c 3 están obligados todos a ser cero. La última ecuación 
proporciona c 3 = 0. Luego, la siguiente ecuación proporciona c 2 = 0, y al sustituir en la 
primera ecuación se obliga a que c¡ = 0. La única combinación que produce el vector 
cero es la combinación trivial. El espacio nulo de A contiene sólo al vector cero c r = 
c 2 - c 3 = 0. 

Las columnas de A son independientes exactamente cuando N(A) — (vector cero). 


Un razonamiento semejante es válido para los renglones de A, que también son inde¬ 
pendientes. Suponga que 


ci(3, 4, 2) + c 2 (0, 1,5)+ c 3 (0, 0, 2) = (0, 0, 0). 

A partir de las primeras componentes se encuentra que 3^ = 0 o c¡ =0. Luego, las segun¬ 
das componentes proporcionan c 2 = 0, y finalmente c 3 = 0. 

Los renglones diferentes de cero de una matriz en forma escalonada U deben ser in¬ 
dependientes. Además, si se eligen las columnas que contienen a los pivotes, también son 
linealmente independientes. En el ejemplo previo, con 


Dos renglones independientes 
Dos columnas independientes 


"1 3 3 2" 

U = 0 0 3 1 , 

0 0 0 0 


las columnas pivote 1 y 3 son independientes. Ningún conjunto de tres columnas es inde¬ 
pendiente, y ciertamente tampoco ninguno de cuatro. Es cierto que las columnas 1 y 4 tam¬ 
bién son independientes, pero si el último 1 cambia a 0, entonces serían dependientes. Por 
tanto, lo que garantiza su independencia son las columnas que contienen a los pivotes. 
A continuación se proporciona la regla general: 

2F Los r renglones diferentes de cero de una matriz escalonada U y una matriz re- 
■ ducida R son linealmente independientes. También las r columnas que contienen a 
los pivotes son linealmente independientes. 

Ejemplo 4 Las columnas de la matriz identidad de n por n son independientes: 

10 - 0 " 

0 1-0 
- - - 0 ' 

0 0 0 1 
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, „ re p r esentan vectores unitarios en las direcciones coordenadas; 

Estas columnas e t , ■ ■ ■ ,e n representan 

en R 4 , r , r n -i 

[11 rol o ° 

0 - 1 e 3 =?. «4 = 0 • 

« 1 * 0 ' * 2 ~ 0 ’ 3 1 ° 

o , L°j L 0 J L - 

La mayor parte de los conjuntos de cuatro vectores en R 4 son independientes. Estos 
podrían ser el conjunto más seguro. , 

Para comprobar la independencta de un de¬ 
escribirse en las columnas de A. ^ eS “ e 0 gi nQ hay var i a bles libres ( rango n), no 

pendientes si hay otra soluciona? sQn indep Ldientes. Si el rango es menor 

Í, etrton^^por lo meiKJS uña Variable libre puede ser diferente de cero y las columnas 

“ r"— ~>"s; 

nentes, de modo que A es una matriz e m p haber n ivoteS5 ya que no hay 

siadas columnas para ser independientes.ranees menor que n. Todo sistema Ac = 0 con 
suficientes renglones para acomodarlos El rango es menor que 

más incógnitas que ecuaciones tiene soluciones c * 0. 


2G Un conjunto de n vectores en R" debe ser Idealmente dependie 


r Híofra7ada de 2C: Todo sistema Ax — 0 de m por 
El lector reconocerá esto como una forma 

n tiene soluciones diferentes de cero si n > m. 


Ejemplo 5 Los oes siguientes colon™ en R* no pueden ser independientes: 


ri 2 r 

A " [l 3 2 • 

Para encontrar la combinación de las columna, con la ,« s. obtiene cero se resuelve 
Ac = 0; 

r [12 1 

A U ~ [O 1 1 ‘ 


más la tercera es igual a cero: Dependencia. 


Cómo generar un subespacio 


A continuación se defina io ,« se entiende por el b^o de *» 
generen m espacio. El espacio columna de A es generado por las coiumn 

clon produce todo el espacio* 


. loe combinacioaes lineales de-U/ lr - *» 

* espado - Todo vector * en v es ^ com ~ 

binación de las ws: _ ... x. c . w . para algunos coeficientes c«. 

Todo v proviene de tus v — c l lv ¡ t rc¿u- e p ° 


2.3 Independencia lineal, base y dimensión 


de incluir el vector cero, e incluso a todos los vectores. 

Ejemplo 6 Los vectores w t = (1, 0, 0), w 2 = (0, 1, 0), y w 3 = (-2, 0, 0), generan un plano (el plano 
x-y) en R 3 . Los dos primeros vectores también generan este plano, mientras w¡ y u> 3 sólo 
generan una recta. 

Ejemplo 7 El espacio columna de A es exactamente el espacio generado por sus columnas. El espa¬ 
cio renglón es generado por los renglones. La definición se hace para ordenar. Al multipli¬ 
car A por cualquier x se obtiene una combinación de las columnas; es un vector Ax en el 
espacio columna. 

Los vectores de coordenadas e- L ,.... e n que provienen de la matriz identidad generan 
R". Todo vector b = (b 1 , . .. . b n ) es una combinación de estas columnas. En este ejemplo 
los pesos son las componentes b¡ mismas: b = ¿>,0?, ■+■••• + b„e n . Sin embargo, ¡las co¬ 
lumnas de otras matrices también generan R"! 


Base de un espacio vectorial 

Para decidir si b es una combinación de las columnas, se intenta resolver Ax = b. Para de¬ 
cidir si las columnas son independientes, se resuelve Ax = 0. La. generación implica al es¬ 
pacio columna, y la independencia implica al espacio nulo. Los vectores de coordenadas 
e u . . . ,e n generan R" y son linealmente independientes. En términos bastos, ningún vec¬ 
tor en ese conjunto se desperdicia. Esto conduce al concepto crucial de base. 

Á" ' r.: • " • • ,• - . . '• . •. \ • ■*;' •' 1 : 

t 


21 Una base de V es una sucesión de vectores que cumplen dos propiedades a la vez: 
'1.: Los vectores son linealmente independientes (no hay demasiados vectores). 

2. Los vectores generan el espacio V (no hay muy pocos vectores). 


s>. ' ' 


Esta combinación de propiedades es absolutamente fundamental para el álgebra lineal. 
Significa que todo vector en el espacio es una combinación de los vectores de la base, ya 
que éstos generan el espacio. También significa que la combinación es única: Si v = a^i 
+ • • • + a k v k y también v = b x v x + ■ • • + b k v k , entonces al restar se obtiene 0 = 1{a t - 
b¡)v¡. Es ahora que entra enjuego la independencia: todo coeficiente a, - b¡ debe ser cero. 
En consecuencia, a¡ = b¡. Hay una y sólo una forma de escribir v como una combinación 
lineal de los vectores de la base. 

Hubiera sido mejor decir de una vez que los vectores de coordenadas e x , . . . , e n no 
son la única base de RL Algunas cosas en álgebra son únicas, pero no ésta. Un espacio vec¬ 
torial tiene una infinidad de bases distintas. Siempre que una matriz cuadrada es inverti¬ 
ble, sus col umnas son independientes, de modo que son una base de R". Las dos columnas 
de la siguiente matriz no singular constituyen una base de R 2 : 


Todo vector bidimensional es una combinación de estas columnas (¡independientes!). 



Capítulo 2 Espacios vectoriales 

F¡onlnln o F1 nlano ,. v de la figura 2.4, es justo R 2 . El vector v¡ en sí es linealmente independiente. 

Ejemplo B pero fracasa en generar R 2 . Los tíes vectores tq, u» v 3 ciertamente generan R~, pero no son 

independientes Dos vectores cualesquiera de esos, por ejemplo v { y v 2 , tienen ambas pro 
pSÍ g"™ «1 espacio y son independie**. Así, consñmyen «»> base. Observe de 
nuevo que un espacio vectorial no tiene una base única. 

y 


X 


Figura 2.4 Conjunto generador v¡, v 2 , v 3 . Bases v„ v z y tq, v 3 y v 2 , v 3 . 

Ejemplo 9 Las cuatro siguientes columnas generan el espacio columna U, pero no son independien 
tes: 

'1 3 3 2' 

Matriz escalonada U — 0 0 3 1 . 

0 0 0 0 

Hay muchas posibilidades para la base, pero se propone una opción específica: Las colum¬ 
nas que contienen pivotes (en este caso la primera y la tercera, que corresponden a bsvan* 
bles básicas) constituyen una base de espacio columna. Estas columnas son ^ e pendient s^ 
y es fácil ver que generan el espacio. De hecho, el espacio columna de U e s justo el plano 
x . y dentro de R 3 . C(U) no es lo mismo que el espacio columna C(A) antes de la eliminación, 
sin embargo, el número de columnas independientes no cambia. 

En resumen: Las columnas de cualquier matriz generan su espacio columna. Si son 
independientes, constituyen una base del espacio columna, sin importar que a mamz sea 
cuadrada o rectangular. Si se pide que las columnas sean una base para todo el espacio , 
entonces la matriz debe ser cuadrada e invertible. 

Dimensión de un espacio vectorial 

Un espacio tiene una infinidad de bases distintas, aunque todas estas opciones tienen algo 
en común. El número de vectores de la base es una propiedad del espacio en si: 

2J Dos bases cualesquiera de un espacio vectorial V contienen el mismo numero de 
vectores. Este número que es compartido por todas las bases y expresa el numero 
de “grados de libertad” del espacio, es la dimensión de V. 

Hay que demostrar este hecho: Todas las bases posibles contienen el mismo núme¬ 
ro de vectores. El plano x-y en la figura 2.4 tiene dos vectores en cada base; su dimensión 

es 2. 
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. . ■ , 2.3 Independencia lineal, base y dimensión 

- •: oEi. URUGUAY 

•. ¡v ti*. 

En tres dimensiones se requieren tres vectores, ya sea a lo largo de los ejes x-y-z 6 en otras 
tres direcciones (¡linealmente independientes!) La dimensión del espacio R" es n. La di¬ 
mensión del espacio columna de U en el ejemplo 9 era 2; era un “subespacio bidimensio- 
nal de R 3 .” La matriz cero es más bien excepcional, ya que su espacio columna contiene 
sólo al vector cero. Por convencionalismo, el conjunto vacío es una base de ese espacio, y 
su dimensión es cero. 

A continuación se presenta el primer gran teorema en álgebra lineal: 

Si iq,.. ., v m y w u ..., w n son dos bases del mismo espacio vectorial, enton¬ 
ces m = n. El número de vectores es el mismo. 

Demostración Suponga que hay más ws que vs (n > m). Se llegará a una contradicción. 
Debido a que las vs constituyen una base, deben generar el espacio. Toda Wj puede escri¬ 
birse como una combinación de las vs: si iiq = a n v + • ■ • + a ml v m , esta es la primera 
columna de una multiplicación de matrices VA: 

a\\ 

«mi 

No se conoce cada a¡j, pero sí la forma de A (es de m por n). El segundo vector w 2 también 
es una combinación de las vs. Los coeficientes de esa combinación llenan la segunda co¬ 
lumna de A. La clave es que A tiene un renglón para cada v y una columna para cada w. A 
es una matriz corta pero ancha, ya que n > m. Hay una solución diferente de cero para 
Ajc = 0. Así, VAx — 0, que es Wx = 0. ¡ Una combinación de las ws da cerol Las ws po¬ 
drían no ser una base, de modo que no es posible que n > m. 

Si m> n, se intercambian las vs y las w s y se repiten los mismos pasos. La única for¬ 
ma de evitar una contradicción es si m = n. Así se termina la demostración de que m = n. 
Repitiendo: La dimensión de un espacio es el número de vectores que hay en cada base. ■ 

Esta demostración se usó antes para demostrar que todo conjunto de m + 1 vectores 
en R™ debe ser dependiente. Las vs y las ws no necesitan ser vectores columna: la demos¬ 
tración fue toda concerniente a la matriz A de coeficientes. De hecho, puede verse este re¬ 
sultado general: En un subespacio de dimensión k, ningún conjunto de más de k vectores 
puede ser independiente, y ningún conjunto con menos de k vectores puede generar el es¬ 
pacio. 

Hay otros teoremas “duales”, de los cuales sólo se menciona uno. Puede empezarse con 
un conjunto de vectores que sea demasiado pequeño o demasiado grande, y terminar con la 
base siguiente: 

. 21 Cualquier conjunto linealmente independiente en ¥ puede extenderse a una ba¬ 
se, sumando más vectores sí es necesario. 

Cualquier conjunto generado en V puede reducirse a una base, eliminando vecto¬ 
res si es necesario. 

La cuestión es que una base es un conjunto independiente maximal. No puede hacerse 
más grande sin perder independencia. Una base también es un conjunto independiente mi¬ 
nimal. No es posible hacerlo más pequeño y seguir generando el espacio. 

El lector debe observar que el término “dimensional” se utiliza en dos sentidos diferen¬ 
tes. Se habla sobre un vector tetradimensional, haciendo referencia a un vector que está en 
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R. Ahom se ha defMo ». «ó L'eSSÍ 

veetores que es.fc en R» cuyas componentes pnuu n» y ulm»g. ^ 

M c— •» que es iguU * - 

J TuZla*, como se demos»* en la slgu.ente «==« 




Los problemas 1 a 10 son sobre independencia, y dependencia lineal, 
í. Demestre que iq, t*. v 3 son independientes pero que v„ v 2 , v* u 4 son depen rentes. 



Resuelva cqiq + • • • + C 4 V * ~ 0 0 bien Ac °' LaS VS ^ ^ ^ COlUmn 
j. Encuentre el mayo, ndm.ro posible de vector» Independientes entre los s.guremest 



n j — Dnhienf = 0(3 casos), entonces las columnas de U son 
3. Demuestre que si a = 0, d - 0 o bien/ u caso 

dependientes: b c~ 

U = 0 d e ■ 

4 Si a <¿fen el problema 3 son todos distintos de cero, demuestre que la única solución 
de f } x = 0 es x = 0. Así, las columnas de U son independientes. 

5. Decida la dependencia o independencia de 

a) Los vectores (1, 3, 2), (2, 1, 3), y (3, 2, l). 

b) Los vectores (1,-3, 2), (2, 1, -3), y (-3, 2, 1). 

■ j j. tt r neeo eliia otras dos. Haga lo mismo pa- 

6 . Escoja tres columnas independientes de U. Luego euja o 

ra A /Encontró bases para estos espacios? 

r 2 3 4 11 [2 3 4 i 

V- » S o 9 » A -[o 0 0 \- 

las us que dé cero. 

8 Si w, «q w 3 son vectores independientes, demuestre que las sumas tq = w 2 + w 3 
8 , Si ^ + ^ ^ independi entes. (Escnba c,xq + c 2 u 2 + c 3 u 3 

0 2 en términos de las tus. Encuentre, y resuelva ecuaciones para las es.) 


2.3 Independencia lineal, base y dimensión 
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9. Suponga que iq, u 2 , u 3 y u 4 son vectores en R 3 . 

á) Estos cuatro vectores son dependientes porque_. 

b) Los dos vectores tq y v 2 son dependientes porque ___. 

c ) Los vectores iq y (0, 0, 0) son dependientes porque_. 

10. Encuentre dos vectores independientes en el plano x + 2y — 3z — t = 0 en R 4 . Lue¬ 
go encuentre tres vectores independientes. ¿Por qué no cuatro? ¿De cuál matriz es és¬ 
te el espacio nulo? 

Los problemas 11 a 18 son sobre el espacio generado por un conjunto de vectores. 
Considere todas las combinaciones lineales de los vectores. 

11. Describa el subespacio de R 3 (¿es una recta, un plano o R 3 ?) generado por 

a) Los vectores (1, 1, —1) y (—1, —1, 1). 

b) Los vectores (0, 1, 1) y (1, 1, 0) y (0, 0, 0). 

c) Las columnas de una matriz escalonada de 3 por 5 con 2 pivotes. 

d) Todos los vectores con componentes positivas. 

12. El vector b está en el subespacio generado por las columnas de A cuando hay una so¬ 
lución de_. El vector c está en el espacio renglón dé A cuando hay una solución 

de_. ¿Falso o verdadero ?: Si el vector cero está en el espacio renglón, los renglo¬ 

nes son dependientes. 

13. Encuentre las dimensiones de 

a) El espacio columna de A, 

b) El espacio columna de U, 

c) El espacio renglón de A, 

d) El espacio renglón de U. 

¿Cuáles de estos dos espacios son iguales? 


'1 

1 

0' 

'1 

1 

0' 

1 

3 

1 y 

u = 0 

2 

1 

3 

1 

-1 

0 

0 

0 


14 . Escoja* = (* 1( * 2 . x 3 < * 4 ) en R 4 . Tiene 24 reordenamientos como (x 2 > x¡, x 3 , x 4 ) y (x 4 , 
x 3 , Xi, x 2 ). Estos 24 vectores, incluyendo * mismo, generan un subespacio S. Encuen¬ 
tre vectores específicos * de modo que la dimensión de S sea: a) 0, b) 1, c) 3, d) 4. 

15. v + w y v — w son combinaciones de v y w. Escriba vy w como combinaciones de 

v + w y v — w. Los dos pares de vectores_el mismo espacio. ¿Cuándo constitu¬ 

yen una base para el mismo espacio? 

16. Establezca si los siguientes vectores son o no linealmente independientes, resolvien¬ 
do c¡ iq +- c 2 v 2 + c 3 u 3 + C 4 .U 4 = 0 : 

ti f 1 ! r°1 r°‘ 

i 0 0 1 

v i ~ 0 > «2 = ! - «3 “ J , »U = o • 

oj |oJ L 1 ] L 1 - 

También decida si generan R 4 , intentando resolver Ciiq + - • • + c 4 v 4 = (0, 0, 0, 1). 

17. Suponga que los vectores cuya independencia habrá de comprobarse se escriben en los 
renglones, en vez de en las columnas de A. ¿Cómo decide el proceso de eliminación 
de A a U si los vectores son o no independientes? 
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18 . Para decidir si b está en e l ¿Culfl.'^el reOTtodo'pMa 0 

lores w son las columnas de A, e miente resolver /u 6 

w = (1 1 0), w 2 = (2, 2, 1), W 3 = (0, 0, 2), b = (3, 4, 5)? 

% Z\ = S; 2’, 0), 4 = (2, 5, 0), «3 = (0, o, 2), u, 4 = (0, o, 0), y cualqmer M 

Los problemas 19 a 37 son sobre los requerimientos para una base. 

»• si..-«— i ^r:s^°rvSr , »“»“ 

Estos vectores son una-para ese espeta01 

de~cualquier matriz de m por n, entonces m es-que n. 

20. Encuentre una base para cada uno de los siguientes subespacios de R 4 : 

a) Todos los vectores cuyas componentes son iguales. 

b) Todos los vectores tales que la suma de sus componentes es cero. 

c ) Todos los vectores perpendiculares a (1, 1, 0, 0) y (1, 0, 1, IX r, 0 , 0 n 

d) El espacio columna (en R 2 ) y el espacio nulo (en R ) de U - [„ i o i oj • 

21. Encuentre tres bases distintas para el espacio columna de la matriz U anterior. Luego 
encuentre dos bases distintas para el espacio renglón de U. 

22. Suponga que v 15 v 2 ,. .., v 6 son seis vectores en R 4 . 

a) Estos vectores (generan)(no generan)(podrían. generar) R . 

b) Estos vectores (son)(no son)(podrían ser) linealmente independientes. 

c) Cuatro cualesquiera de esos vectores (son)(no son)(podrían ser) una base de R . 

d) Si esos vectores son las columnas de A, entonces Ax - b (tiene)(no tiene po 
tener) una solución. 

„ r „ columnas de A son n vectores de R m . Si son linealmente independientes, ¿cuál es 
' el rango de A? Si generan R m , ¿cuál es el rango? Si son una base de R , entonces 6 que 

ocurre? 

24 Encuentre una base del plano x - 2y + 3z - 0 en R 3 - Luego encuentre una base: pa- 
' fa la intersección de ese plano con el plano xy. Luego encuentre una base de todos 
vectores perpendiculares al plano. 

25. Suponga que las columnas de una matriz invertible A de 5 por 5 son una base de R 3 . 

a) La ecuación Ax = 0 sólo tiene la solución x = 0 porque-, 

b) Si b está en R s , entonces Ax = b es resoluble porque-. 

Conclusión: A es invertible. Su rango es 5. 

26. Suponga que S es un subespacio pentadimensional de R 6 , ¿Falso o verdadero? 
d) Toda base de S puede extenderse a una base de R 6 sumando un vector mas. 
tí) Toda base de R 6 puede reducirse a una base de S quitando un vector. 

27. U se obtuvo a partir de A restando el renglón 1 del renglón 3: 

1 3 2' 

0 1 1 
1 3 2_ 

Encuentre bases de los dos espacios columna. Encuentre bases de los dos espacios ren¬ 
glón. Encuentre bases de los dos espacios nulos. 


1 3 2 

0 11 - 
0 0 0 
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28. ¿Falso o verdadero? (proporcione una razón aceptable). 

d) Si las columnas de una matriz son dependientes, también lo son los renglones. 
tí) El espacio columna de una matriz de 2 por 2 es el mismo que su espacio renglón. 

c) El espacio columna de una matriz de 2 por 2 tiene la misma dimensión que su es¬ 
pacio renglón. 

d) Las columnas de una matriz son una base para el espacio columna. 

29. ¿Para cuáles números c y d el rango de las siguientes matrices es 2? 


'1 

2 

5 

0 

5 1 Te di 

0 

0 

c 

2 

2 y B = c . 

0 

0 

0 

d 

2 J t- - 1 


30. Localice los pivotes, para encontrar una base del espacio columna de 

'0 5 4 3' 

0 0 2 1 
U 0 0 0 0 ’ 

0 0 0 0 _ 

Exprese cada columna que no está en la base como una combinación de las columnas 
de la base. También encuentre una matriz A con esta forma escalonada U, pero cuyo 
espacio columna sea diferente. 

31. Encuentre un contraejemplo de la siguiente afirmación: Si v¡, v 2 , v 3 , v 4 es una base 
del espacio vectorial R 4 , y si W es un subespacio, entonces algún subconjunto de las 
vs es una base de W. 

32. Encuentre las dimensiones de los siguientes espacios vectoriales: 

a) El espacio de todos los vectores en R 4 tales que la suma de sus componentes es cero. 
tí) El espacio nulo de la matriz identidad de 4 por 4. 
c) El espacio de todas las matrices de 4 por 4. 

33. Suponga que se sabe que la dimensión de V es k. Demuestre que 
a) cualesquiera k vectores independientes en V son una base; 

tí) cualesquiera k vectores que generan V son una base. 

En otras palabras, si se sabe que el número de vectores es correcto, entonces una de las 
dos propiedades de una base implica a la segunda. 

34. Demuestre que si Y y W son subespacios vectoriales tridimensionales de R 5 , entonces 
Y y W deben tener en común un vector diferente de cero. Sugerencia: Empiece con ba¬ 
ses de los dos subespacios, formando seis vectores en total. 

35. ¿ Falso o verdadero ? 

a) Si las columnas de A son linealmente independientes, entonces Ax — b tiene exac¬ 
tamente una solución para toda b. 

b) Una matriz de 5 por 7 nunca tiene columnas linealmente independientes. 

36. Si A es una matriz de 64 por 17 con rango 11, ¿cuántos vectores independientes cum¬ 
plen Ax = 0? ¿cuántos vectores independientes cumplen A T y = 0? 

37. Encuentre una base de cada uno de los siguientes subespacios de matrices de 3 por 3: 
a) Todas las matrices diagonales. 

tí) Todas las matrices simétricas (A T = A). 

c) Todas las matrices sesgadas simétricas (A T = —A). 



kííTiuj 



a los que ios --vectores" son funciones. 

iplen % = 0. 

;umpla 5^ = 3. 


c) Encuentre todas las funciones que cumplen 3. 


• o»™ ÍT contiene todas las combinaciones y(x) - A eos x + B eos 2x -r 

39. El espacio coseno tí 3 contiene iuu® _ _ n 

C eos 3x. Encuentre una base del subespacio que cump y( ) 


40. Encuentre una base pa» el espacio de las tacones que cumplen lo si S uiente: 


») ^-2,-0. 

dx 




r \ „ (Vi V íxl son tres funciones distintas de x. El espacio vectonal 
“• dimensión 1, X 3. Proporcione un ejemplo de ». » 0«e 

muestre cada posibilidad. 


42. Encuentre una base para el espacio de los polinomios p(x> de grado . 3. Encuentre 
una base para el subespacio de p(l) 0. 

43. ¡Escriba la matriz identidad de 3 por 3 como una combm™ 
trices permutación! Luego demuestre 

pendientes. Suponga queunacom m PP permutaciones son una base del su- 

JZgZZSZSZZZZZ-* A-»- *-• 

44. Repaso: ¿En cuáles de los siguientes incisos se muestran bases de R ? 


a) (1,2,0) y (0, 1, -D- 

b ) (1, 1,-1), (2, 3, 4), (4, 1,-1). (0,1. D- 

c) (1, 2, 2),( —1, 2, 1),(0, 8, 0). 

d) ( 1 , 2 , 2 ),( — 1 , 2 , 1 ),( 0 , 8 , 6 ). 


luble cuando [A b] es singular. _____ _ 


2.4 LOS CUATRO SUBESPACI 0 S FUNDAMENTALES 


Utl '^os^ubespacios^uederTdescribirse en dos ^^^“1%“" 

SSSStsi!-- 

sistemático. 
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1 


El lector puede adivinar cuál debe ser el procedimiento. Cuando la eliminación sobre 
A produce una matriz escalonada U o una reducida R, para cada uno de los subespacios aso¬ 
ciados con A se encuentra una base. Luego tiene que considerarse el caso extremo de ran¬ 
go total: 


Cuando el rango es lo más grande posible, r — n or = m o r = m = n, la matriz tie¬ 
ne una inversa izquierda B, o una inversa derecha C o una A~ 1 por ambos lados. 

Con la finalidad de organizar todo el análisis, cada uno de los cuatro subespacios se abor¬ 
dará a su vez. Dos de ellos son conocidos y dos son nuevos. 

1. El espacio columna de A se denota por C(A). Su dimensión es el rango r. 

2. El espacio nulo de A se denota por N(A). Su dimensión es n — r. 

3. El espacio renglón de A es el espacio columna de A T . Es C(A T ), y es generado por los 
renglones de A. Su dimensión también es r. 

4 . El espacio nulo izquierdo de A es el espacio nulo de A T . Contiene a todos los vecto¬ 
res y, tales que A T y = 0, y se escribe N(A T ). Su dimensión es_. 

La cuestión sobre los dos últimos subespacios es que provienen de A T . Si A es una ma¬ 
triz de m por n, es posible ver cuáles espacios “huéspedes” contienen a los cuatro subespa¬ 
cios, al observar el número de componentes: 

El espacio nulo N(A) y el espacio renglón C(A T ) son subespacios de R". 

El espacio nulo izquierdo ¿V(A T ) y el espacio columna C(A) son subespacios de R™. 

Los renglones tienen n componentes y las columnas tienen m. Para una matriz sencilla 


A — U — R — 


1 0 0 
0 0 0 ’ 


el espacio columna es la recta que pasa por [ ‘ ]. El espacio renglón es la recta que pasa por 
[10 0] T . Está en R 3 . El espacio nulo es un plano en R 3 y el espacio nulo izquierdo es una 
recta en R 2 : 

’°1 Í°1 rol 

N(A) contiene 1 y 0 , N(A T ) contiene 

oj |_iJ 

Observe que todos los vectores son vectores columna. Incluso los renglones están traspues¬ 
tos, y el espacio renglón de A es el espacio columna de A T . Nuestro problema es relacionar 
los cuatro espacios para U (después de la eliminación) con los cuatro espacios para A: 


Ejemplo 

básico 


proviene de 


Como novedad, los cuatro espacios se considerarán en un orden más interesante. 

3. El espacio renglón de A Para cada matriz escalonada como U, el espacio renglón es evi¬ 
dente. Contiene a todas las combinaciones de los renglones, como ocurre con cualquier es¬ 
pacio renglón, aunque aquí el tercer renglón no contribuye a nada. Los dos primeros 
renglones son una base del espacio renglón. Una regla semejante es válida para toda ma¬ 
triz escalonada U o R, con r pivotes y r renglones diferentes de cero: los renglones dife¬ 
rentes de cero son una base, y la dimensión del espacio renglón es r. Esto facilita tratar 
con la matriz original A. 
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2M El espacio renglón de A tiene la misma dimensión r que e ^ fZ7SZ£ 

U, y tiene las mismas bases, porque los espacios renglón de Ay U (y R) son igu , • 

T O ra7Ón es aue cada operación elemental deja sin cambio el espacio renglón. Los renglo¬ 
nes ^1/ son combinaciones de los renglones originales en A. En consecuencia, el espacio 
renglón de U no contiene nada nuevo. Al mismo tiempo, debido a que cada paso puede in- 
vertirse nada se pierde; los renglones de A pueden recuperarse de U. Es cierto que los 
glones de A y U son distintos, pero las combinaciones de los renglones son identic . 

‘^bsTetue no se empezó con los « renglones de A, que generan ^cio^ón, 
v aue se eliminan m-r de ellos para terminar con una base. Según 2L, hubiera podi 
cerseloantóor. Sin embargo, podría ser difícil decidir 

les eliminar, por lo que fue más fácil considerar los renglones de U diferentes de cero. 

7 El espacio nulo de A La eliminación simplifica un sistema de ecuaciones lineales 
i» 2SSSL- El sistema sU = 0 se ,educe td sistema U, - ». y 
es reversible El espacio nulo de A es el mismo que el espacio nulo de U y R. S 
ÜTcTSne, A,- ¡> son independien». Al elegir 1» „ - r “solncones especies 
de = o se obtiene una base definida para el espacio nulo. 

2N La dimensión del espacio nulo ¿V(A) es n-r. Las “soluciones especiales''son 
una base- a cada variable libre se asigna el valor 1, mientras las otras variables hbr . 
son 0. Así, Ax = 0 oUx = 0oRx = 0 proporcionan las vanables pivote por sustitu¬ 
ción hacia atrás. 

Ésta es exactamente la forma en que se ha venido resolviendo Ux - 0. El ^ aS1C ° 

anterior tiene pivotes en las columnas 1 y 3. En consecuencia, sus vanables libres 
columnas segunda y cuarta, u y y. La base del espacio nulo es 

3*1 

v = 1 _ 1 v =° ^ = 

Soluciones especiales x ¡ ~ o ’ v = i 

y = u y 1 

_ 0 

Cualquier combinación c* + Oj tiene a c en su componeme v, y^n su componen¬ 
te y. La única forma en que c l x l + c 2 x 2 - 0 es que Ci c 2 , 
teres son independientes. También generan el espacio nulo; la solución completa 
,, r Acf i os „ _ r = 4 - 2 vectores son una base. 

2 ' El espacio nulo también se denomina kemel de A, y su dimensión n r es la nulidad. 

1 El espacio columna de A El espacio columna a veces se denomma rango^Esto es 
consistente con la idea de costumbre que se tiene respecto del contradomimo como el co 
junto de todos los valores posibles/(x); * está en el dominio y/(x) esta en el contrado 
nio En nuestro caso, la función es /(*) = Ax. Su dominio consta de todas » en R su 
contradominio consta de todos los vectores posibles Ax, que es el espacio columna. (E 

edición previa a ésta se denominó R(A). . E { es _ 

El problema consiste en encontrar base para los espacios columna y • 
nados son distintos (¡simplemente observe las matrices!) aunque su dimensión es hms 

LÍ columnas primera y tercera de U son una base de su espacio columna. Se trata 
de to columnas que contienen a los pivotes. Cualquier otra columna es una combinación de 
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estas dos. Además, lo mismo es cierto para la A original; aun cuando sus columnas son di¬ 
ferentes. Las columnas pivote de A son una base de su espacio columna. La segunda co¬ 
lumna es tres veces la primera, justo como en U. La cuarta columna es igual a (columna 3) 
— (columna 1). El mismo espacio nulo indica estas dependencias. 

Lo anterior se debe a que Ax = 0 exactamente cuando Ux = 0. Los dos sistemas son 
equivalentes y tienen las mismas soluciones. La cuarta columna de U también era (colum¬ 
na 3) — (columna 1). Toda dependencia lineal Ax = 0 entre las columnas de A es compen¬ 
sada por una dependencia t/x = 0 entre las columnas de U, con exactamente los mismos 
coeficientes. Si un conjunto de columnas de A es independiente, entonces también lo son 
las columnas correspondientes de U, y viceversa. 

Con la finalidad de encontrar una base del espacio columna CÍA), se usa lo que ya se 
ha hecho para U. Las r columnas que contienen a los pivotes son una base del espacio co¬ 
lumna de U. Estas mismas r columnas se elegirán en A; 


20 , La dimensión del espacio columna C(A) es igual, al rango, r, que. tam 
a la dimensión (del espacio renglón; El número de columnas independie 
al número de renglones independientes. Una base para C(A) se forma 
lumnas en A que corresponden, en U, a las columnas que contienen a los 


— i 


¡El espacio renglón y el espacio columna tienen la misma dimensión r! Este es uno de 
los teoremas más importantes en álgebra lineal. A menudo se abrevia como “ rango de los 
renglones = rango de las columnas ”, Expresa un resultado que, para una matriz aleatoria 
de 10 por 12 no es para nada evidente. También dice algo sobre las matrices cuadradas; Si 
los renglones de una matriz cuadrada son linealmente independientes, entonces también lo 
son las columnas (y viceversa). De nuevo, esto no parece autoevidente (por lo menos, no 
para el autor). 

Para ver otra vez que la dimensión del espacio columna y del espacio renglón de U es 
r, considere una situación típica con rango r = 3. La matriz escalonada U ciertamente tie¬ 
ne tres renglones independientes: 


di * * * * * 

_ ~0 0 0~j d-i * * 

U ~ 0 0 0 0 0 1 d-j ' 

_ 0 0 0 0 0 0 _ 


Se afirma que U también tiene tres columnas independientes y no más que tres. Estas colum¬ 
nas sólo tienen tres componentes diferentes de cero. Si puede demostrarse que las columnas 
pivote: la primera, la cuarta, y la sexta, son linealmente independientes, entonces debe haber 
una base (¡para el espacio columna de U, no el de A!) Suponga que una combinación de es¬ 
tas columnas pivote produjo cero: 



Trabajando hacia arriba como de costumbre, c 3 debe ser cero porque el pivote d 3 # 0; así, 
c 2 debe ser cero porque el pivote d 2 =£ 0; y finalmente c t = 0. Con esto se establece la in- 
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El espacio columna y el espacio renglón se vuelven evidentes después de la eta™a- 
ción sobre A. A continuación se abordará el cuarto subespacio fundamental, 
tenido silenciosamente fuera de la vista. Debido a que los tres ^ 

M( A \ v C(A r ) el cuarto espacio debe ser 1V(A T ). Es el espacio nulo de la traspuesta, o el es 
XA.V, - 0 significa ,«e y T A - 0. y .i vector aparece e„ e, «e„- 

bro izquierdo de A. 


4. El espado -o iaqul.rto de A (- espacio ordo de A*) Si A » «» de a, P«r 

„ entonces A T es de n por m. Su espacio nulo es un subespacxo de R , el vector y tiene m 
sTse escribe como /A - 0. estas compon»,es multipl.can los neones de 

A para producir el renglón cero: 

y T A = [yi • • • ym] A = [0 • • • 0]. 

La dimensión de este espacio nulo N(A T ) es fácü de encontrar. Para cualquier matriz, 
el número de variables pivote más el número de variables libres debe corresponder al nu- 
ÍZZZ," LJ. Par. A, «. r + (» - r) - «. En Orias patatas, el tango mas las 

nulidades igual a n: 

dimensión de CÍA) + dimensión de NÍA) = número de columnas. 

Esta ley se aplica igualmente a A T , que tiene m columnas. A T es tan buena matriz como A. 
Pero la dimensión de su espacio columna también es r, de modo que 

r + dimensión (N(A r )) = m. W 


........... --o- • yí 

, v. •* T _ 

2P La dimensión del espacio nulo izquierdo N(A ) es m r. 


Las m — r soluciones de y T A = 0 se esconden en alguna parte durante laeteúnacióm 
Los renglones de A se combinan para producir los m - r renglones cero de U. Se empieza 
con PA = W o con l PA = U. Los últimos m - r renglones de la matnz invemble L P 
deben ser una base de las ys en el espacio nulo izquierdo, ya que multiplican a A para pro 

^^Endíjemplo de^ por 4, el renglón cero era el renglón 3 - 2(renglón 2) + 5(renglon 
1) En consecuencia, las componentes dey son 5, -2,1. Esta es la misma combinación que 
ea Z 2b 2 + 56, en el miembro derecho, lo cual lleva .0-0 como la ecuación = final. 
Ese vector y es una base para el espacio nulo izquierdo, cuya dimensión es m r 
2 = 1 Es el último renglón de L~'P, y produce el renglón cero enl/,ya menudo puede 
verse sin necesidad de calcular L~\ Cuando se está desesperado, siempre es posible resol- 

^ P Me dTcuen Í ie = que hasta el momento, en este libro, no se ha proporcionado ningu¬ 
na razón paía tener cuidado sobre !V(A T ). Es correcto pero no convincente si en cursivas se 
escribe qíe el espacio nulo izquierdo siempre es importante. En la siguiente sección se n 
jora el tema de encontrar un significado físico para y, a partir de la ley de la comente de 

Kirchhoff. 


Ahora ya se conocen las dimensiones de los cuatro espacios. Pueden resumirse en una 
tabla, y aún así falta mucho para poder indicarlas como el 


Teorema fundamental del álgebra linea!, parte 1 

1. C(A) = espacio columna de A; dimensión r. 

2. N(A) — espacio nulo de A; dimensión n — r. 


A = 


espacio nulo JV(A T ) 
múltiplos de (3, —1) 


espacio renglón C(A T ) espacio nulo 2V( A) 
múltiplos de (1, 2) T múltiplos de (2, —1) 



Figura 2.5 Los cuatro subespacios fundamentales (rectas) de la matriz singular A. 


Si el último elemento de A se cambia de 6 a 7, todas las dimensiones son diferentes. 
La dimensión del espacio columna y el espacio renglón es r = 2. El espacio nulo y el es¬ 
pacio nulo izquierdo sólo contienen a los vectores x = 0 y y = 0. La matriz es invertible. 

Existencia de inversas 

Se sabe que si A tiene una inversa izquierda (BA = 1) y una inversa derecha (AC = f), en¬ 
tonces las dos inversas son iguales: B = B(AC) = ( BA)C = C. Así, por el rango de una 
matriz, es fácil decidir cuáles matrices tienen en realidad estas inversas. En términos gene¬ 
rales, una inversa existe sólo cuando el rango es lo más grande posible. 

El rango siempre cumple rSmy también r sS n. Una matriz de m por n no puede 
tener más de m renglones independientes o n columnas independientes. No hay espacio pa¬ 
ra más de m pivotes, o más de n. Se quiere demostrar que cuando r = m hay una inversa de¬ 
recha, y que Ax = b siempre tiene una solución única. Cuando r = n, hay una inversa 
izquierda y la solución (si existe) es única. 

Sólo una matriz cuadrada puede tener ambos r = m y r = n, y en consecuencia sólo 
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20, EXISTENCIA: Rango renglón total r — m. Ax b tiene por lo menos una 
Lli, si y Sao si”» columnas g®» K".A* ,n,«r- 

CQ rlprprh-, C tal aue AC = t m (de m por m). Esto sólo es posible si m — n. 
UNICIDAD: Rango columna total r = n. Ax = b tiene cuando mucho ima so- 
toda * si y sólo si las columnas son linealmente 
ces A tiene una inversa izquierda B de n por m tal que BA - /„. Esto solo es posible 

sim2i¡. 

En el caso de existencia, una solución posible es x — Cb, ya que entonce 
ACb = fe. Sin embargo, hay otras soluciones si hay otras inversas derechas. El numero de 

soluciones cuando las columnas generan IT es l o oo. __ _ __ ^ pero 

En el caso de unicidad, si hay una solución de Ax - b, debe 

nuede no haber solución. El número de soluciones es 0 o 1. 

Hay fórmulas sencillas para encontrar las mejores inversas izquierda y derecha, 
so de existir: 

Inversas por un lado B = (A T A) 'A t y C = A (AA ) 


Ejemplo 2 


Ciertamente BA = / y AC = /. Lo que no es tan cierto es que A T A y AA T son realmente m- 
vertibles En eícapímlo 3 se demostrará que A T A tiene inversa si el rango es », y AA tie- 
itehtverstfcuando^el rango es Así, las fórmulas tienen sentido exactamente cuando el 
rango es lo más grande posible, y se encuentran las inversas por un lado. 

Considere una matriz sencilla de 2 por 3 con rango 2: 

_ [4 0 °' 

A ~ [O 5 0 ' 

Debido a que r = m = 2, el teorema garantiza una inversa derecha C: 


C 31 C32 


5 


1 0 
0 1 ■ 


Hay muchas inversas derechas porque el último renglón de C es completamente arbitrario. 
Este es un"io de existencia pero no de unicidad. La matriz A no tiene mversa ^qurerda 
“i 1> última columna do BA es cortamente cero. La inversa derecha esp.c.fic. C - 
A t (AA t ) 1 elige que c 3l y c 32 sean cero. 


La mejor inversa derecha A T (AA T ) 


Esta es la seudoinversa: una forma de escoger la mejor C en la sección 6.3. La traspuesta 
de A, lleva a un ejemplo de una infinidad de inversas izquierdas: 

T [I 0 bn 1 \ 4 °] _ [1 01 

BA t = * , , 0 5 - o 1 ' 

0 i ¿23 0 0 *- 


Ahora, la que es completamente arbitraria es la última columna de B. La iz¬ 

quierda (también la seudoinversa) tiene b 13 = b 23 = 0. Este es un “caso de unicidad , cuan¬ 
do el rango es r = n. 
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No hay variables libres, ya que n — r = 0. Si existe una solución, es única. El lector pue¬ 
de ver cuándo este ejemplo tiene una solución o no tiene solución. 


4 

0 


0 


0 

5 


0 




¿>2 es resoluble exactamente cuando b 3 = 0. 

h_ 


Una matriz rectangular no puede tener tanto existencia como unicidad. Si m es diferente de 
n, entonces no puede cumplirse r = my r = n. 

Una matriz cuadrada constituye el caso opuesto. Si m = n, no puede cumplirse una pro¬ 
piedad sin la otra. Una matriz cuadrada tiene una inversa izquierda si y sólo si tiene una 
inversa derecha. Sólo hay una inversa; a saber, B = C = A -1 . Cuando la matriz es cuadra¬ 
da, la existencia implica la unicidad y la unicidad implica la existencia. La condición para 
invertibilidad es el rango total: r = m = n. Cada una de las siguientes condiciones es una 
prueba necesaria y suficiente: 


1. Las columnas generan R", de modo que Ax — b tiene por lo menos una solución para 
toda b. 

2. Las columnas son independientes, de modo que Ax = 0 sólo tiene la solución x = 0. 

Esta lista puede hacerse mucho más grande, especialmente si se piensa en los capítulos ul¬ 
teriores. Cada condición es equivalente a cualquier otra, lo cual asegura que A es invertible. 


3. Los renglones de A generan R". 

4. Los renglones son linealmente independientes. 

5. Es posible completar la eliminación: PA — LDU, con todos los n pivotes. 

6. El determinante de A es diferente de cero. 

7. El cero no es un valor característico de A. 

8. A t A es positiva definida. 


A continuación se presenta una aplicación típica a polinomios P(t) de grado n — 1. El 
único de estos polinomios que se hace cero en tt n es Pit) = 0. Ningún otro polino¬ 
mio de grado n — 1 puede tener n raíces. Esto es unicidad, e implica existencia: Dados va¬ 
lores cualesquiera b u . . . , b„, existe un polinomio de grado n — 1 que interpola estos 
valores: P{t¡) — b¡. La cuestión es que está tratando con una matriz cuadrada; el número n 
de coeficientes en P{t) — x¡ + x 2 t + ■ ■ ■ + x n t"~ l corresponde al número de ecuaciones: 


Interpolación 
P(A) = b, 


1 h 
1 t 2 f| 

1 A ^ 



Esta matriz de Vandermonde es de n por n y con rango total. Ax = b siempre tiene una so¬ 
lución: un polinomio puede pasar por cualquier b¡ en puntos distintos í¡. Después se encon¬ 
trará realmente el determinante de A; no es cero. 


Matrices de rango 1 

Por último llega el caso más sencillo, cuando el rango es lo más pequeño posible (excepto 
por la matriz cero con rango 0). Uno de los temas básicos de las matemáticas es, dado algo 
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complicado, demostrar cómo puede descomponerse en piezas sencillas. Para el álgebra li¬ 
neal, las piezas sencillas son las matrices de rango 1 . 


Rango 1 


tiene r 


1][2 1 1 ] 

2 


Cada renglón es un múltiplo del primer renglón, de modo que el esp TVT/uTvTcwTco 
mensional. De hecho es posible escribir toda la matriz como el producto de un vector co 

lumna y un vector renglón: 

r 2 i ii r ii[2 i i] 

4 2 2 _ 2 

A = (columna)(renglón) g 4 4 ~ 4 

-2 -1 -lj L _1 . 

El producto de una matriz de 4 por 1 y una matriz de 1 por 3 es una matriz de 4 por 3. El 
rango de este producto es 1. Al mismo tiempo, las columnas son todos los múltiplos del 
mismo vector columna; el espacio columna comparte la dimensión r - 1 , y se reduce a un 

recta. _____ 

Toda matriz con rango 1 tiene Informa sencilla A = = columna por renglón. 

Todos los renglones son múltiplos del mismo vector v T , y todas las columnas son múlti¬ 
plos de u. El espacio renglón y el espacio columna son rectas: el caso más sencillo. 

Conjunto de problemas 2.4 

1. Falso o verdadero: Si m = n, entonces el espacio renglón de A es igual al espacio co¬ 
lumna. Si m < n, entonces el espacio nulo tiene una dimensión mayor que-. 

2. Encuentre la dimensión, y construya una base para los cuatro subespacios asociados 
con cada una de las siguientes matrices 

„ _ fO 1 4 °] v r, = [° 1 4 0 . 

A- n?80 y 0000 


Encuentre 


la dimensión y una base para los cuatro subespacios fundamentales de 


'1 

2 

0 

r 

"1 

2 

0 

r 

0 

1 

1 

0 

y U = 0 

1 

1 

0 

1 

2 

0 

1 

1 ° 

0 

0 

0 


4. Describa los cuatro 


subespacios en el espacio tridimensional asociados con 


0 1 0 
0 0 1 
0 0 0 


5 Si el producto AB es la matriz cero, AB = 0, demuestre que el espacio columna aso¬ 
ciado de B está contenido en el espacio nulo de A. (También, el espacio renglón de A 
está en el espacio nulo izquierdo de B, ya que cada renglón de A multiplica B para ob¬ 
tener un renglón cero.) 
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6 . Suponga que A es cualquier matriz de m por n de rango r. ¿En qué condiciones sobre 
estos números 

a) A tiene una inversa por ambos lados: AA~‘ = A~*A = P. 

b) Ax = b tiene una infinidad de soluciones para toda bl 

7. ¿Por qué no existe ninguna matriz cero cuyos espacios renglón y nulo contengan a (1, 
1 , 1 )? 

8 . Suponga que la única solución de Ax = 0 (m ecuaciones en n incógnitas) es x = 0. 

¿Cuál es el rango y por qué? Las columnas de A son linealmente_. 

9. Encuentre una matriz de 1 por 3 cuyo espacio nulo conste de todos los vectores en R 3 
tales que Xi + 2x 2 + 4x 3 = 0. Encuentre una matriz de 3 por 3 con el mismo espacio 
nulo. 

10. Si Ax = b siempre tiene por lo menos una solución, demuestre que la única solución 
de A r y — 0 es y — 0. Sugerencia: ¿Cuál es el rango? 

11. Si Ax = 0 tiene una solución diferente de cero, demuestre que A r y = /falla en ser re¬ 
soluble para algunos miembros derechos/. Construya un ejemplo de A y /. 

12. Encuentre el rango de A, y escriba la matriz como A = uv r : 


'1 

0 

0 

3 1 [2 

-2 

0 

0 

0 

o y A = 

-6 

2 

0 

0 

6 J L 



13. Si se proporcionan a , b, c con a =£ 0, escoja d de modo que el rango de 


sea 1. ¿Cuáles son los pivotes? 

14. Encuentre una inversa izquierda y/o una inversa derecha (cuando existan) para 


1 1 0 
0 1 1 


1 0 
M = 1 1 


a b 
0 a 


15. Si las columnas de A son linealmente independientes (A es de m por n), entonces el 

rango es_, el espacio nulo es_, y existe una inversa_. 

16. (Una paradoja) Suponga que A tiene una inversa derecha B. Así, AB = I conduce a 
A t AB = A t o B = (A T A)“ I A T . Sin embargo, satisface BA = /; es una inversa izquier¬ 
da. ¿Cuál paso no está justificado? 

17. Encuentre una matriz A cuyo espacio renglón sea V, y una matriz B cuyo espacio nu¬ 
lo sea V, si V es el subespacio generado por 


18. Encuentre una base de cada uno de los cuatro subespacios de 


0 

1 

2 

3 

4 1 

" 1 

0 

0 I 

0 

1 

2 

4 

6 = 

1 

1 

0 

0 

0 

0 

1 

2 J 

0 

1 

1J 


0 12 3 4 
0 0 0 1 2 
0 0 0 0 0 
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19. 

20 . 

21 . 

22 . 

23. 

24. 

25. 

26. 

27. 

28. 

29. 


Si A tiene los mismos cuatro subespacios fundamentales que B, ¿es cierto que A cBl 

a) Si el rango de una matriz de 7 por 9 es 5, ¿cuáles son las dimensiones de los cua¬ 
tro subespacios? ¿Cuánto es la suma de los cuatro subespacios? 

b) Si el rango de una matriz de 3 por 4 es 3, ¿cuáles son el espacio columna y el es¬ 
pacio nulo izquierdo? 

Construya una matriz con la propiedad requerida, o explique por qué no es posible. 

a) El espacio columna contiene a i , o , el espacio renglón contiene a | 2 j , j^ 5 j • 

L°J [u 

b) El espacio columna tiene como base a i , el espacio nulo tiene como base a 2 j . 

c) La dimensión del espacio nulo = 1 + dimensión del espacio nulo izquierdo. 

d ) El espacio nulo izquierdo contiene a [3] el espacio renglón contiene a [i] • 

e) Espacio renglón = espacio columna, espacio nulo A espacio nulo izquierdo. 

Sin eliminación, encuentre las dimensiones y bases de los cuatro subespacios de 


'0 

3 

3 

3' 

'1 

r 

A = 0 

0 

0 

0 

y B = 4 

4 

0 

1 

0 

1 

[5 

5 


Suponga que una matriz A de 3 por 3 es invertible. Escriba bases de los cuatro subes¬ 
pacios de A, y también para la matriz de 3 por 6 B = [A A]. 

¿Cuáles son las dimensiones de los cuatro subespacios de A, B, y C, si / es la matriz 
identidad de 3 por 3, y 0 es la matriz cero de 3 por 2? 


A — [l O] y 


I i 
0 T 0 T 


c = [0]. 


¿Cuáles subespacios son iguales para las siguientes matrices de tamaños distintos? 


a) [A] 


Demuestre que el rango de estas tres matrices es el mismo: r. 

Si los elementos de una matriz de 3 por 3 se escogen aleatoriamente entre 0 y 1, ¿cuá¬ 
les son las dimensiones más probables de los cuatro subespacios? ¿Qué ocurre si la 
matriz es de 3 por 5? 

(Importante) A es una matriz de m por n con rango r. Suponga que hay miembros de¬ 
rechos b para los cuales Ax = b no tiene solución. 

a) ¿Cuáles desigualdades (< o s) deben ser ciertas entre m, n, y r? 

b ) ¿Cómo se sabe que A T y — 0 tiene una solución diferente de cero? 

Construya una matriz con (1, 0, 1) y (1, 2, 0) como una base para su espacio ren¬ 
glón y su espacio columna. ¿Por qué esta base no puede ser una base del espacio 
renglón y del espacio nulo? 

Sin calcular A, encuentre bases de los cuatro subespacios fundamentales: 


A = 


1 0 0 
6 10 
9 8 1 


12 3 4 
0 12 3 
0 0 12 
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30. Si se intercambian los dos primeros renglones de una matriz A, ¿cuáles de los cuatro 
subespacios permanecen igual? Si y = (1, 2, 3, 4) está en el espacio nulo izquierdo de 
A, escriba un vector en el espacio nulo izquierdo de la nueva matriz. 

31. Explique por qué v = (1,0, —1) no puede ser un renglón de A y también estar en el 
espacio nulo. 

32. Describa los cuatro subespacios de R 3 asociados con 


‘0 

1 

0 ' 

[ 1 

1 

0 ' 

A = 0 

0 

1 

y I + A = 0 

1 

1 

0 

0 

0 

0 

0 

1 


33, (Espacio nulo izquierdo) Sume la columna extra b, y reduzca A a forma escalonada: 

[12 3 bi] [12 3 b x 

[A b] = 4 5 6 b 2 -> 0 -3 -6 b 2 -4b¡ 

[7 8 9 ¿> 3 j [0 0 0 b 3 -2b 2 +b x 


Una combinación de los renglones de A produjo el renglón cero. ¿Qué combinación 
es? (Observe b 3 — 2 b 2 + b ¡ en el miembro derecho.) ¿Cuáles vectores están en el es¬ 
pacio nulo de A T , y cuáles están en el espacio nulo de A? 

34. Siga el método del problema 33 para reducir A a forma escalonada, y busque los ren¬ 
glones cero. La columna b indica cuáles combinaciones de los renglones se tomaron. 


"1 2 b x ~ 

a) 3 4 b 2 • 

_4 6 b 2 _ 



2 

3 

4 

5 


b x ' 

b 2 

b 3 

b A _ 


A partir de la columna b después de la eliminación, lea m — r vectores de la base en 
el espacio nulo izquierdo de A (combinaciones de renglones que proporcionan cero). 

35. Suponga que A es la suma de dos matrices de rango 1: A = uv T + wz T - 

a) ¿Cuáles vectores generan el espacio columna de A? 

b) ¿Cuáles vectores generan el espacio renglón de A? 

c) El rango es menos de 2 si_o si_. 

d) Calcule A y su rango, si u = z = (1, 0, 0) y v = w = (0, 0, 1). 


36. Sin multiplicar las matrices, encuentre bases de los espacios renglón y columna de A: 


A = 


1 2 
4 5 


3 0 3' 

1 1 2 / 


¿Cómo se sabe a partir de estas formas que A no es invertible? 

37. ¿Falso o verdadero? (Según corresponda, proporcione una razón o un contraejemplo.) 

a) A y A t tienen el mismo número de pivotes. 

b) A y A t tienen el mismo espacio nulo izquierdo. 

c) Si el espacio renglón es igual al espacio columna, entonces A T = A. 

d) Si A t = —A, entonces el espacio renglón de A es igual al espacio columna. 
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38. Si AB = 0, las columnas de B están en el espacio nulo de A. Si estos vectores están en 
R n , demuestre que rango(A) + rango(B) =£ n. 

39. ¿Es posible completar un juego de “gato” (tic-tac-toe) (5 unos y 4 ceros en A) de mo 
do que rango(A) = 2, pero que en ningún lado se tenga una jugada ganadora. 

40. Construya una matriz de 2 por 3 de rango 1. Copie la figura 2.5, y ponga un vector en 
cada subespacio (dos en el espacio nulo). ¿Cuáles vectores son ortogonales. 

41. Vuelva a dibujar la figura 2.5 para una matriz de 3 por 2 de rango r = 2. ¿Cuál subes¬ 
pacio es Z (sólo el vector cero)? La parte del espacio nulo de cualquier vector renR 

es X n =_. 


n Z5 SRÁFICAS Y REDES 

No estoy muy contento con la matriz de 3 por 4 en la sección previa. Desde un punto de 
vista teórico, era bastante satisfactoria; los cuatro subespacios eran calculables y sus di¬ 
mensiones r n — r, r, m — r eran diferentes de cero. Sin embargo, el ejemplo no fue pro¬ 
ducto de una verdadera aplicación. No mostró cuán fundamentales realmente son estos 

SUte En esTa sección se presenta una clase de matrices rectangulares con dos ventajas. Son 
sencillas y son importantes. Son matrices de incidencia de gráficas, y cada elemento es 1 
- 1, o 0. Lo extraordinario es que lo mismo es cierto de L, U y vectores de la base para los 
cuatro subespacios. Estos subespacios desempeñan un papel central en la teona de redes. 
Se recalca que el término “gráfica” no se refiere a la gráfica de una función (como una pa¬ 
rábola para y = x 2 ). Hay un segundo significado, completamente distmto, mas próximo a 
las ciencias de la computación que al cálculo, que es fácil explicar. Esta sección es opcio¬ 
nal, pero constituye una oportunidad para ver en acción a las matrices rectangulares, asi co 
mo la forma en que la matriz simétrica cuadrada A A aparece al final. 

Una gráfica consta de un conjunto de vértices o nodos y un conjunto de aristas que 
unen a los nodos. La gráfica de la figura 2.6 tiene 4 nodos y 5 ansias. No tone una-ansia 
entre los nodos 1 y 4 (y las aristas de un nodo hacia si mismo están prohibidas). Esta gr 
fica es dirigida, debido a la flecha que hay en cada arista. 

La matriz de incidencia arista-nodo es de 5 por 4, con un renglón para cada ansta. 
Si la arista va del nodo j al nodo k, entonces ese renglón tiene 1 en la columna] y 
en la columna k. La matriz de incidencia A se muestra junto a la gráfica (aunque también 
podría recuperarse la gráfica si sólo se contara con A). El renglón 1 muestra la ansta d 
nodo 1 al nodo 2. El renglón 5 proviene de la quinta ansta, que va del nodo 3 al nodo 4. 


2 [-110 0 ' 

-10 10 
arista 4 A— 0—1 1 0 

0-101 

4 [ 0 0 - 1 

nodo 12 3 4 

Figura 2.6 Gráfica dirigida (5 aristas, 4 nodos, 2 circuitos) y su matriz de incidencia A. 



2.5 Gráficas y redes 


indica qué arista entra y qué arista sale. Las aristas 2 y 3 entran, la arista 5 sale (con el sig¬ 
no menos). Algunas veces A se denomina matriz conectividad o matriz topología. Cuando 
la gráfica tiene m aristas y n nodos, A es de m por n (y normalmente m > n ). Su traspues¬ 
ta es la matriz de incidencia “nodo-arista”. 

Cada uno de los cuatro subespacios fundamentales tiene un significado en términos de 
la gráfica. Es posible hacer algo de álgebra lineal, o escribir sobre voltajes y corrientes. 
¡Haremos ambas cosas! 

Espacio nulo de 4; ¿Existe una combinación de columnas que proporcione Ax = 0? 
Normalmente, la respuesta se obtiene a partir de la eliminación, aunque aquí viene a pri¬ 
mera vista. La suma de las columnas es la columna cero. El espacio nulo contiene a x = 
(1, 1, L l),ya que Ax = 0. La ecuación Ax = b no tiene una solución única (en caso de te¬ 
ner alguna solución). Cualquier “vector constante” x = ( c, c, c, c) puede sumarse a cual¬ 
quier solución particular de Ax — b. La solución completa tiene esta constante arbitraria c 
(como la 4-C cuando se integra en cálculo). 

Esto tiene un significado si se piensa que x¡, x 2 , x 3 , x 4 son los potenciales (voltajes) 
en los nodos. Las cinco componentes de Ax proporcionan las diferencias de potencial a tra¬ 
vés de las cinco aristas. La diferencia a través de la arista 1 es x 2 — x t , proveniente del ± 1 
en el primer renglón. 

La ecuación Ax = b solicita: Dadas las diferencias b¡,..., b¡, encontrar los potencia¬ 
les verdaderos x,.x 4 . ¡Pero esto es imposible de hacer! Todos los potenciales pueden 

aumentarse o disminuirse por la misma constante c, y las diferencias permanecen sin cam¬ 
bio, lo cual confirma que x = ( c, c, c, c) está en el espacio nulo de A. Estos son los únicos 
vectores en el espacio nulo, ya que Ax = 0 significa igual potencial a través de cada arista. 
El espacio nulo de esta matriz de incidencia es unidimensional. El rango es 4 - 1 = 3. 

Espacio columna: ¿Para cuáles diferencias b¡,..., b 5 es posible resolver Ax = b? Para 
encontrar una prueba directa, considere la matriz. El renglón 1 más el renglón 3 es igual al 
renglón 2. En el miembro derecho se requiere b¡ + b 3 = b 2 , o ninguna solución es posi¬ 
ble. De manera semejante, el renglón 3 más el renglón 5 es igual al renglón 4. El miembro 
derecho debe satisfacer b 3 + b 5 — b 4 , para que la eliminación llegue a 0 = 0. Repitiendo, 
si b está en el espacio columna, entonces 

b\ — b 2 + ¿> 3 = 0 y ¿3 — + b 5 = 0. (1) 

Continuando la investigación, también se encuentra que los renglones 1+4 son iguales a 
los renglones 2 + 5. Pero esto no es nada nuevo: al restar las ecuaciones en (1) en realidad 
se obtiene ¿q + b 4 = b 2 + b¡. Hay dos condiciones sobre las cinco componentes, ya que 
la dimensión del espacio columna es 5 — 2. Estas condiciones provienen de la eliminación, 
pero aquí tienen un significado sobre la gráfica. 

Circuitos'. La ley del voltaje de Kirchhoff establece que la suma de las diferencias de po¬ 
tencial alrededor de un circuito debe ser cero. Alrededor del circuito superior en la figura 2.6, 
las diferencias satisfacen (x 2 — x^ + (x 3 — x 2 ) = (x 3 — x t ). Estas diferencias son ¿q + b 3 = 
b 2 - Para recorrer todo el circuito y regresar al mismo potencial, se requiere b 3 + b s = b 4 . 

2R La prueba para que b esté en el espacio columna es la ley del voltaje de Kirch¬ 
hoff'. La suma de las diferencias de potencial alrededor de un circuito debe ser cero. . 
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Espacio nuio izquierdo: Para resolver A T y = 0, se encuentra su significado en la gráfi¬ 
ca. El vector y tiene cinco componentes, una para cada arista. Estos números representan 
corrientes que circulan a lo largo de las cinco aristas. Debido a que A es de 4 por 5, las 
ecuaciones A T y = 0 proporcionan cuatro condiciones sobre estas cinco comentes. Se trata 
de condiciones de “conservación” en cada nodo: En cada nodo, el flujo de entrada es 
igual al flujo de salida: 

_ 3 , l _ y 2 =o La corriente total hacia el nodo 1 es cero 
yx - y 3 - y 4 = 0 h acia el nodo 2 

aT >' = 0 y 2 + y 3 - y s = 0 hacia el nodo 3 

+ y s = o hacia el nodo 4 

La belleza de la teoría de redes es que tanto A como A T tienen papeles importantes. 

Resolver A T y = 0 significa encontrar un conjunto de corrientes que no se amontone 
en ningún nodo. El tráfico continúa circulando, y las soluciones más sencillas son las co¬ 
rrientes alrededor de circuitos pequeños. Nuestra gráfica tiene dos circuitos, y alrededor 
de cada circuito se envía 1 amp de comente: 

Vectores de circuito yf — [l ~~ 1 i 0 0] y y 2 “ ® ^ ^ 

Cada circuito produce un vector y en el espacio nulo izquierdo. La componente +1 ° - 1 
indica si la comente va en el sentido de la flecha o en contra. Las combinaciones de y, y 
y, llenan el espacio nulo izquierdo, por lo que y, y y 2 son una base (la dimensión ten a 
que ser m — r = 5 — 3 = 2). De hecho, y, - y 2 = (L -1. 0, L ~1) proporciona el gran 

circuito alrededor de la parte externa de la gráfica. 

El espacio columna y el espacio nulo izquierdo están relacionados estrechamente. El 
espacio nulo izquierdo contiene ay, = (1, -1, L 0, 0), y los vectores en el espacio colum¬ 
na satisfacen b x - b 2 + b 3 = 0. Así, y T b = 0: ¡los vectores en el espacio columna y en e 
espacio nulo izquierdo son perpendiculares! Esto pronto se convertirá en la parte dos del 
‘Teorema fundamental del álgebra lineal.” 


Espacio renglón: El espacio renglón de A contiene vectores en R , pero no a todos los 
vectores. Su dimensión es el rango r = 3. Con la eliminación se encuentran tres renglones 
independientes, y también es posible ver la gráfica. Los tres primeros renglones son depen¬ 
dientes (renglón 1 + renglón 3 = renglón 2, y estas aristas forman un circuito). Los ren¬ 
glones 1, 2, 4 son independientes porque las aristas 1, 2, 4 no contienen circuitos. 

Los renglones 1, 2, 4 son una base del espacio renglón. En cada renglón, la suma de 
los elementos es cero. Toda combinación {fx.h.hJfl el espacio renglón tiene la misma 
propiedad: 

/en el espacio renglón /. + /a + /s + A = 0 * en el espacio nulo x = c(l, 1, 1, 1) (2) 


Nuevamente, esto ilustra el teorema fundamental: el espacio renglón es perpendicularal es¬ 
pacio nulo. Si f está en el espacio renglón y x está en el espacio nulo, entonces-f x — . 

Para A T , la ley básica de la teoría de redes es la ley de la corriente de Kirchhoff. El flu¬ 
jo total hacia cada nodo es cero. Los números f x ,h,h,h son fuentes de comente hacia los 
nodos. La fuente/, debe equilibrar a -y, - y 2 , que es el flujo que sale del nodo 1 (a lo lar¬ 
go de las aristas 1 y 2). Esta es la primera ecuación en A T y = /. De manera semejante en os 
otros tres nodos, la conservación de la carga requiere flujo ríe entrada = flujo de salida. Lo 



2s; Las ecuaciones A -y — f en los nodos expresan la ley de la corriente de Kirchhqfl 
La corriente neta hacia cada nodo es cero , Flujo de entra' a = fhifo dEsaUda, 

. ..Esta ley sólo, puede cumplirse si la corriente total provemente 1 de fuera es/,+ / 2 + 
f 3 A f 4 = 0. Con / = 0, la ley A T y = 0 es satisfecha por una comente que recorre 
el circuito. 

Árboles generadores y renglones independientes 

Toda componente de y, y y 2 en el espacio nulo izquierdo es 1 o — 1 o 0 (provenientes de 
los flujos en el circuito). ¡Lo mismo es cierto para x = (1, 1, 1, 1) en el espacio nulo, y to¬ 
dos los elementos en PA = LDU\ La cuestión clave es que todo paso de la eliminación tie¬ 
ne un significado para la gráfica. 

El significado puede observarse en el primer paso de la eliminación para la matriz A: res¬ 
te el renglón 1 del renglón 2. Esto sustituye a la arista 2 por una nueva arista “1 menos 2”; 

arista 1 

renglón 1 —110 0 

renglón 2 —10 10 

renglón 1—2 0 1—1 0 

Ese paso de la eliminación destruye una arista y crea una nueva arista. Aquí la arista “1 — 2” 
es justo la arista 3 anterior en dirección opuesta. El siguiente paso de la eliminación produce 
ceros en el renglón 3 de la matriz. Esto demuestra que los renglones 1, 2, 3 son dependien¬ 
tes. Los renglones son dependientes si las aristas correspondientes contienen un circuito. 

Al final de la eliminación se tiene un conjunto completo de r renglones independien¬ 
tes. Estas r aristas constituyen un árbol: una gráfica sin circuitos. Nuestra gráfica tiene 
r— 3, y las aristas 1, 2, 4 forman un árbol posible. El nombre completo es árbol generador 
porque el árbol “genera” todos los nodos de la gráfica. Un árbol generador tiene n — 1 aris¬ 
tas si la gráfica es conexa, y si se incluye una arista más se obtiene un circuito. 

En el lenguaje del álgebra lineal, n — 1 es el rango de la matriz de incidencia A. La 
dimensión del espacio renglón es n — 1. El árbol generador que se obtiene de la elimina¬ 
ción constituye una base para el espacio renglón: cada arista del árbol corresponde a un ren¬ 
glón en la base. 

El teorema fundamental del álgebra lineal relaciona las dimensiones de los subespacios: 
Espacio nulo: dimensión 1, contiene ax = (1, . .., 1). 

Espacio columna: dimensión r = n — 1, cualesquiera n — 1 columnas son indepen¬ 
dientes. 

Espacio renglón: dimensión r — n — 1, renglones independientes de cualquier árbol 
generador. 

Espacio nulo izquierdo: dimensión m — r = m — n + 1, contiene ys de los circuitos. 

Estos cuatro espacios proporcionan la fórmula de Euler, que de alguna manera es el pri¬ 
mer teorema en topología. Cuenta aristas de dimensión cero menos aristas unidimensiona¬ 
les más circuitos bidimensionales. Ahora cuenta con una demostración del álgebra lineal 
para cualquier gráfica conexa: 

(# de nodos) — (# de aristas) + (# de circuitos) = ( n ) — ( m ) A (m — n A 1) = 1. (3) 
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Para un simple circuito de 10 nodos y 10 aristas, el número de Euler es 10 10 + 1- Si 

todos y cada uno de esos 10 nodos están unidos a un undécimo nodo en el centro, enton¬ 
ces 11 - 20 + 10 sigue siendo 1. _ . 

Todo vector/en el espacio columna tiene x r f = fi + ' • • + Jn ~ la ;> uma de ias 
corrientes provenientes del exterior es cero. Todo vector b en el espacio columna tiene 
v T b = 0; la suma de las diferencias de potencial es cero alrededor de todos los circuitos. 
En algún momento, * y y se vincularán mediante una tercera ley (ley de Ohm para cada 
resistor). Primero nos quedamos con la matriz A para presentar una aplicación que parece 
frívola pero no lo es. 

Clasificación de los equipos de fútbol 

Al final de esta temporada, los equipos de fútbol colegial son clasificados según vanas en¬ 
cuestas. La clasificación es esencialmente un promedio de opiniones, y algunas veces se 
vuelve vaga después de las primeras doce universidades. Se desea clasificar a todos los 

equipos de acuerdo con una base más matemática. 

El primer paso es reconocer la gráfica. Si el equipo; jugó contra el equipo fe, entonces 
entre ambos hay una arista. Los equipos son los nodos, y los juegos son las aristas. Hay unos 
cientos de nodos y algunos miles de aristas, a las que se asignará una dirección mediante una 
flecha que va del equipo visitante al equipo local. En la figura 2.7 se muestra parte de la í- 
cra Ivy, así como algunos equipos serios, y también una universidad que no es famosa por sus 
logros en fútbol colegial. Afortunadamente para esa universidad (en donde estoy escribien¬ 
do estas líneas), la gráfica no es conexa. En términos matemáticos, no es posible demostrar 
que el MIT no es el número 1 (a menos que ocurra que juegue contra alguien). 

Harvard Yale Michigan USC Texas 



Princeton Purdue Ohio State Notre Dame Georgia Tech 

Figura 2.7 Parte de la gráfica de fútbol americano colegial. 

Si el fútbol fuese perfectamente consistente, a cada equipo podría asignarse un po¬ 
tencial” x¡. Así, si un equipo visitante v juega con el equipo local h, entonces ganaría e 
equipo que tuviera mayor potencial. En el caso ideal, la diferencia b en el resultado sena 
exactamente igual a la diferencia x h - x v en sus potenciales. ¡Ni siquiera tendnan que ju¬ 
gar! Habría acuerdo por completo en que el mejor equipo es aquel con mayor potencia . 

Este método presenta dos dificultades (por lo menos). Se está intentando encontrar un 
número x para cada equipo, y se desea x h - x v = b¡ para cada juego. Esto significadnos 
cuantos miles de ecuaciones y sólo unos cuantos cientos de incógnitas.. Las ecuaciones 
x — x = b. van a un sistema lineal Ax = b, donde A es una matriz de incidencia, todo 
juego tiene un renglón, con +1 en la columna h, y -1 en la columna v, con la finalidad de 

indicar qué equipos jugaron ese partido. , 

Primera dificultad: Si b no está en el espacio columna no hay solución. Los resultados 
deben ajustarse perfectamente o no es posible encontrar potenciales exactos. Segunda difi¬ 
cultad: Si A tiene vectores diferentes de cero en su espacio nulo, los potenciales x no están 
bien determinados. En el primer caso x no existe; en el segundo, x no es único. Quizá es¬ 
tén presentes ambas dificultades. 
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El espacio nulo siempre contiene el vector de ls, ya que A sólo ve las diferencias 
x h ~ x v- Para determinar los potenciales, arbitrariamente podría asignarse potencial cero a 
Harvard. (Estoy hablando matemáticamente, no asumiéndolo como un hecho). Pero si la 
gráfica no es conexa, entonces toda pieza por separado de la gráfica contribuye a un vec¬ 
tor en el espacio nulo. Incluso está el vector con x Mrr = 1 y todos los demás x, = 0. Es ne¬ 
cesario unir no sólo a Harvard sino a un equipo en cada pieza. (No hay nada de injusto en 
asignar potencial cero; si todos los demás potenciales están abajo de cero, entonces el equi¬ 
po unido se clasifica primero.) La dimensión del espacio nulo es el número de piezas de la 
gráfica: y no habrá forma de clasificar una pieza contra otra, ya que éstas no juegan par¬ 
tidos. 

Parece que el espacio columna es más difícil de describir. ¿Cuáles resultados se ajus¬ 
tan perfectamente bien a un conjunto de potenciales? Ciertamente Ax = b es irresoluble si 
Harvard derrota a Yale, Yale derrota a Princeton y Princeton derrota a Harvard. Más que lo 
anterior, la suma de las diferencias en los resultados de ese circuito de juegos debe ser cero. 

Ley de Kirchhoff para diferencias en los resultados b m + b YP + b PH = 0. 

Ésta también es una ley del álgebra lineal. Ax = b puede resolverse cuando b satisface las 
mismas dependencias lineales que los renglones de A. Así, la eliminación lleva a 0 = 0. 

En realidad, casi con toda certeza b no está en el espacio columna. Los resultados de 
fútbol no son tan consistentes. Para obtener una clasificación es posible utilizar mínimos 
cuadrados: hacer a Ax lo más próximo posible de b. Eso se verá en el capítulo 3, y sólo se 
menciona un ajuste. El ganador obtiene un bono de 50 e incluso 100 puntos por arriba de 
la diferencia en resultados. En caso contrario, ganar por 1 está demasiado próximo a per¬ 
der por 1. Esto hace que las clasificaciones calculadas se aproximen bastante a las encues¬ 
tas, y el doctor Leake (Notre Dame) proporcionó un análisis completo en Management 
Science in Sports (1976). 

Después de escribir esta subsección, encontré lo siguiente en el New York Times: 

En sus clasificaciones finales en 1985, la computadora ubicó a Miami (10-2) en sép¬ 
timo lugar, arriba de Tennessee (9-1-2). Pocos días después de su publicación, al de¬ 
partamento de deportes del Times empezaron a llegar paquetes con naranjas y cartas 
de enojo, enviados por los fanáticos descontentos de Tennessee. La irritación surgió 
del hecho de que Tennessee apabulló a Miami 35-7 en el tazón del azúcar. Las en¬ 
cuestas finales de AP y UPI clasificaron en cuarto lugar a Tennessee, con Miami bas¬ 
tante más abajo. 

Ayer en la mañana llegaron nueve envases de naranjas al muelle de carga. Fueron 
enviadas al hospital Bellevue con una advertencia de que la calidad y contenido de 
las naranjas era incierto. 

Tanto, para esta aplicación del álgebra lineal. 

Redes y matemáticas discretas aplicadas 

Una gráfica se vuelve una red cuando a las aristas se asignan números c¡ . c m . El nú¬ 

mero c¿ puede ser la longitud de la arista i, o su capacidad, o su rigidez (si contiene a un 
resorte), o su conductancia (si contiene un resistor). Estos números van en una matriz dia¬ 
gonal C que es de m por m. C refleja “propiedades materiales”, en contraste con la matriz 
de incidencia A, que proporciona información de las conexiones. 

Nuestra descripción será en términos de electricidad. Sobre la arista i, la conductancia 
es c¡ y la resistencia es 1/c,-. La ley de Ohm establece que la corriente y¿ que pasa 
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por el resistor es proporcional a la caída de tensión e¡. 

Ley de Ohm y, = c¡e¡ (corriente) = (conductancia)(caída de tensión). 

Lo anterior también se escribe E = IR, caída de tensión igual a la corriente mutóplicaj 
por la resistencia. Como una ecuación vectorial sobre todas las aristas a la vez, la ley de 

0hm plra. completar el marco de referencia se requieren la ley del voltaje y la ley de la co¬ 
rriente de Kirchhoff: 

LVK: La suma de las caídas de tensión alrededor de cada circuito es cero. 

LCK: La suma de las corrientes y, (y f¡) hacia cada nodo es cero. 

La ley del voltaje permite asignar potenciales * 1 , a los nodos. Luego las diferen¬ 

cias alrededor de un circuito proporcionan una sumatona como (x 2 x t ) + ^ x z> 

(x _ x,) = 0 en la que todo se cancela. La ley de la comente pide sumar las comentes 
hacia cada nodo por la multiplicación de A T y. Si no hay fuentes de corriente externas, /a 

ley de la corriente de Kirchhoff es A 1 y - 0. . „ „ 

La otra ecuación es la ley de Ohm, pero es necesario encontrar la caída de tensión 
través del resistor. Con la multiplicación Ax se obtuvo la diferencia de potencial entre los 
nodos. Al invertir los signos, -Ax proporciona la caída en potencial Parte de estajaida 
puede deberse a una batería en la arista de intensidad b r El resto de la caída es e b 
Ax a través del resistor: 


Ley de Ohm 


Cib - Ax ) o bien C 'y + Ax - b. 


Las leyes fundamentales de equilibrio combinan las leyes de Ohm y Kirchhoff en un 
problema central de las matemáticas aplicadas. Estas ecuaciones aparecen en todas partes. 


Ecuaciones de equilibrio 


C~ l y + Ax = b 
A T y = /• 


Este es un sistema lineal simétrico, del cual ha desaparecido e. Las incógnitas son las co¬ 
rrientes y y los potenciales x. Usted ve la matriz simétrica por bloques: 


Forma de bloques 


Para eliminación por bloques el pivote es C \ el multiplicador es A T C, y la sustracción 


manda a A T abajo del pivote. El resultado es 


b 

f - ¿ T Cb, 


La ecuación sólo para x está en el renglón inferior, con la matriz simétrica A CA. 
Ecuación fundamental Á^CAx = A^Cb — f. 


(7) 


Luego, la sustitución hacia atrás en la primera ecuación produce y. Nada misterioso: se sus¬ 
tituye y = C(b — Ax) en A T y = / para obtener (7). 

Observación importante Un potencial debe fijarse de antemano. x n — 0. El n ésimo no 
do está conectado a tierra, y la n-ésima columna de la matriz de incidencia original se a 
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eliminado. La matriz resultante es lo que ahora se entiende por A, sus n — 1 columnas son 
independientes. La matriz cuadrada A r CA, que es la clave para resolver la ecuación (7) pa¬ 
ra x, es una matriz invertible de orden n — 1 : 



Ejemplo 1 Suponga que una batería b 3 y una fuente de corriente / 2 (y cinco resistores) conectan cua¬ 
tro nodos. El nodo 4 está conectado a tierra y el potencial x 4 = 0 es fijo. 



La primera cuestión es la ley de la corriente A T y = / en los nodos 1, 2, 3: 

—yi — y3 — ys = 0 —1 0—1 0—1 

y\ — y 2 = fi tiene A T = 1 —1 0 0 0 . 

y 2 + y 3 — y 4 = 0 0 1 1—1 0 

Para el nodo 4 no se ha escrito ninguna ecuación, donde la ley de la corriente es y 4 + y s + 
f 2 = 0. Esto se concluye al haber sumado las otras tres ecuaciones. 

La otra ecuación es C~ l y + Ax = b. Los potenciales x están conectados a las corrien¬ 
tes y por la ley de Ohm. La matriz diagonal C contiene las cinco conductancias c¡ = 1/1?,. 
El miembro derecho explica la batería de intensidad b 3 en la arista 3. La forma de bloque 
tiene a C~ l y + Ax = b arriba de A T y = /: 

1 1 °1 M [°~ 

0 -1 1 y 2 0 

1 0 1 y 3 b 3 

0 0-1 y 4 _ 0 

1 0 0 y 5 0 

xj 0 

h 

X 3 0 _ 

El sistema es de 8 por 8 , con cinco corrientes y cuatro potenciales. La eliminación de las 
ys reduce al sistema de 3 por 3 A T CAx = A r Cb — /. La matriz A T CA contiene los recípro¬ 
cos c¡ = 1 /R¡ (porque en la eliminación se dividen los pivotes). También se muestran el 
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cuarto renglón y la cuarta columna, provenientes del nodo conectado a tierra, fuera de la 
matriz de 3 por 3: 


c t + c 3 + c¡ —C\ 

A T CA = —C\ C\ + C2 

-c 3 -c 2 

—c$ 0 


—c 3 1 -c s (nodo 1) 

— c 2 0 (nodo 2) 

c 2 + c-j + c 4 —c 4 (nodo 3) 

-c 4 c 4 + c 5 (nodo 4) 


El primer elemento esl + 1 + 1, o Ci + c 3 + c 5 cuando se incluye C, ya que las aristas 
1, 3, 5 tocan el nodo 1. El siguiente elemento diagonal es 1 + 1 o c¡ + c 2 , provenientes de 
las aristas que tocan al nodo 2. Fuera de la diagonal, las cs aparecen con signo menos. Las 
aristas hacia el nodo 4 conectado a tierra pertenecen al cuarto renglón y a la cuarta colum¬ 
na, que se borran una vez que la columna 4 se elimina de A (haciendo invertible a A T_ CA). 
La matriz de 4 por 4 debe cumplir que la suma de todos los renglones y todas las colum¬ 
nas es cero, y que (1, 1, 1, 1) debe estar en el espacio nulo. 

Observe que A T CA es simétrica. Tiene pivotes positivos y proviene del marco de re¬ 
ferencia básico de las matemáticas aplicadas que se ilustra en la figura 2.8. 



Figura 2.8 Marco de referencia para equilibrio: fuentes b y /, tres pasos para A T CA. 



En mecánica, x y y se vuelven desplazamientos y esfuerzos. En fluidos, las incógni¬ 
tas son la presión y el caudal de flujo. En estadística, e es el error y x es el mejor ajuste 
por mínimos cuadrados a los datos. Estas ecuaciones matriciales y las ecuaciones diferen¬ 
ciales correspondientes se encuentran en nuestro libro de texto Introduction to Applied 
Mathematics, y en el nuevo Applied Mathematics and Scientific Computing. (Consulte la 
página hww . wellesleycambridge. com.) 

Este capítulo termina en un punto culminante: el planteamiento de un problema fun¬ 
damental en matemáticas aplicadas. A menudo para esto se requiere más habilidad que pa¬ 
ra la solución del problema. En el capítulo 1 se resolvieron ecuaciones lineales como 
primer paso del álgebra lineal. Para plantear las ecuaciones se requiere el conocimiento 
más profundo del capítulo 2. La contribución de las matemáticas, y de la gente, no es la 
computación sino la inteligencia. 

gg Conjunto de problemas 2.5 

1. Para la gráfica triangular de 3 nodos de la siguiente figura, escriba la matriz de inci¬ 
dencia A de 3 por 3. Encuentre una solución de Ax — 0, y describa todos los otros vec¬ 
tores en el espacio nulo de A. Encuentre una solución de ÁJy = 0, y describa todos los 
otros vectores en el espacio nulo izquierdo de A. 

2. Para la misma matriz de 3 por 3, demuestre directamente a partir de las columnas que 
todo vector b en el espacio columna satisface b x + b 2 — ¿> 3 = 0. Deduzca el mismo 
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nodo 1 *i 



nodo 2 arista 2 nodo 3 3/3 x 3 


hecho a partir de los tres renglones: las ecuaciones en el sistema Ax — b. ¿Qué signi¬ 
fica esto sobre las diferencias de potencial alrededor de un circuito? 

3. Demuestre directamente a partir de los renglones que todo vector /en el espacio ren¬ 
glón satisface/! + f z + = 0. Deduzca el mismo hecho a partir de las tres ecuacio¬ 

nes A T y = /. ¿Qué significa esto cuando las/s son corrientes hacia los nodos? 

4. Calcule la matriz A T A de 3 por 3, y demuestre que es simétrica aunque singular: ¿qué 
vectores están en su espacio nulo? Al eliminar la última columna de A (y también el 
último renglón de A T ) se queda con la matriz de 2 por 2 en la esquina superior izquier¬ 
da; demuestre que es no singular. 

5. Escriba la matriz diagonal C con elementos c b c 2 , c 3 en medio, y calcule A T CA. De¬ 
muestre nuevamente que la matriz de 2 por 2 en la esquina superior izquierda es in¬ 
vertible. 

6. Escriba la matriz de incidencia A de 6 por 4 para la segunda gráfica en la figura. El 
vector (1, 1,1,1) está en el espacio nulo de A, pero ahora ahí hay m - n + 1 = 3 vec¬ 
tores independientes que satisfacen A r y = 0. Encuentre tres vectores y, y únalos con 
los circuitos en la gráfica. 

7. Si esa segunda gráfica representa seis juegos entre cuatro equipos, y las diferencias en 
los resultados son b u . . . , b 6 , ¿cuándo es posible asignar potenciales x lt . . . , x 4 de 
modo que la diferencia de potenciales coincida con las bs? Usted está encontrando 
(a partir de las leyes de Kirchhoff o por eliminación) las condiciones que hacen reso¬ 
luble a Ax — b. 

8. Escriba las dimensiones de los cuatro subespacios fundamentales para esta matriz de 
incidencia de 6 por 4, y una base para cada subespacio. 

9. Calcule A T A y A T CA, donde la matriz diagonal C de 6 por 6 tiene los elementos 
c u c 6 . ¿Cómo puede afirmar a partir de la gráfica dónde aparecen las cs en la dia¬ 
gonal principal de A T CA? 

10. Trace una gráfica con aristas numeradas y dirigidas (y con nodos numerados) cuya 
matriz de incidencia es 

'-1 1 0 0 ' 

-10 1 0 

A 0 1 0 -1 ■ 

0 0-1 1 _ 

Esta gráfica, ¿es un árbol? (los renglones de A, ¿son independientes?) Demuestre que 
al eliminar la última arista se obtiene un árbol generador. Así, los renglones restantes 
son una base de__. 
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11. Sin la última columna de la A precedente, y con los números 1 , 2, 2, 1 en la diagonal 
de C, escriba el sistema de 7 por 7 

C~ l y + Ax = 0 
A T y = /. 

Al eliminar y lt y 2 > y 3 > 3A se q ue d a con 1168 ecuaciones A T CAx = — f para x¡,x 2 , x 3 . Re¬ 
suelva las ecuaciones cuando/ =(1,1,6). Con estas corrientes entrando en los nodos 
1 , 2 , 3 de la red, ¿cuáles son los potenciales en los nodos y las corrientes en las aris¬ 
tas? 

12. Si A es una matriz de incidencia de 12 por 7 de una gráfica conexa, ¿cuál es su rango? 
¿Cuántas variables libres hay en la solución de Ax = bl ¿Cuántas variables libres hay 
en la solución de A T y = /? ¿Cuántas aristas deben eliminarse para obtener un árbol 

generador? 

13. En la gráfica anterior con 4 nodos y 6 aristas, encuentre todos los 16 árboles genera¬ 
dores. 

14. Si MIT derrota a Harvard por 35 a 0, Yale empata con Harvard, y Princeton derrota a 
Yale por 7 a 6 , ¿qué diferencias en los resultados en los otros tres juegos (H-P, MIT-P, 
MIT-Y) permiten diferencias de potencial que coincidan con las diferencias en los re¬ 
sultados? Si las diferencias en los resultados se conocen en un árbol generador, enton¬ 
ces se conocen para todos los juegos. 

15. En nuestro método de clasificación de fútbol, ¿es necesario considerar la fuerza de la 
oposición, o ya está considerada? 

16. Si entre cada par de nodos hay una arista (una gráfica completa), ¿cuántas aristas hay? 
La gráfica tiene n nodos, y no se permiten aristas de un nodo hacia sí mismo. 

17. Para las dos gráficas que se muestran a continuación, compruebe la fórmula de Euler: 
(# de nodos) - (# de aristas) + (# de circuitos) = 1 . 


18. Multiplique matrices para encontrar A T A, y conjeture cómo provienen sus elementos 
de la gráfica: 

a) La diagonal de A T A indica cuántos (cuántas)-hay en cada nodo. 

b) Los elementos -1 o 0 fuera de la diagonal indican cuáles pares de nodos son-- 

19. ¿Por qué el espacio nulo de A T A contiene a(l,l,l, 1)? ¿Cuál es su rango? 

20. ¿Por qué una gráfica con n — 6 nodos tiene m — 15 aristas? Un árbol generador que 

une a todos los seis nodos tiene __aristas. ¡Hay n n 2 = 6 4 árboles generadores! 

21. La matriz de adyacencia de una gráfica tiene M¡¡ = 1 si los nodos i y j están unidos 
por una arista (en caso contrario M¡j — 0). Para la gráfica del problema 6 con 6 nodos 
y 4 aristas, escriba M y también M 2 . ¿Por qué ( M a )y cuenta el número de rutas de 2 
pasos del nodo i al nodo p. 
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2.6 TRANSFORMACIONES LINEALES 

Se sabe cómo una matriz mueve los subespacios alrededor cuando se multiplica por A. El 
espacio nulo se va al vector cero. Todos los vectores van hacia el espacio columna, ya que 
Ax siempre es una combinación de las columnas. Pronto verá algo hermoso: que A lleva su 
espacio renglón en su espacio columna, y que sobre estos espacios de dimensión res 100 % 
invertible. Esta es la verdadera acción de A. Parcialmente está escondida por los espacios 
nulos y los espacios nulos izquierdos, que están a ángulos rectos y llevan su propio cami¬ 
no (hacia cero). 

Lo que importa ahora es lo que ocurre dentro del espacio, lo cual significa dentro del 
espacio «-dimensional, si A es de n por n. Esto requiere un análisis más detallado. 

Suponga que x es un vector «-dimensional. Cuando A se multiplica por x, transforma 
ese vector en uno nuevo Ax. Esto ocurre en todo punto x del espacio «-dimensional R”. La 
matriz A transforma todo el espacio, o lo “mapea en sí mismo”. En la figura 2.9 se ilustran 
cuatro transformaciones que provienen de estas matrices: 

1. Un múltiplo de la matriz identidad, A = el , alarga cada vector 
por el mismo factor c. Todo el espacio se dilata o contrae (o de al¬ 
guna forma pasa por el origen y sale por el lado opuesto, cuando 
c es negativo). 

'0 — i j 2. Una matriz rotación hace girar a todo el espacio alrededor del 
1 o origen. Este ejemplo gira 90° a todos los vectores, transformando 

cada punto (x, y) en ( —y, x). 

0 l] 3. Una matriz reflexión transforma a todos los vectores en su ima- 

1 0 gen especular. En este ejemplo el espejo es la recta x = y a 45°, 

y un punto como (2, 2) permanece sin cambio. Un punto como (2, 
—2) se invierte en (—2, 2). Sobre una combinación como v = (2, 
2) + (2, —2) = (4, 0), la matriz preserva una parte e invierte la 
otra. El resultado es Av = (2, —2) + ( —2, 2) = (0, 4). 

¡Esa matriz reflexión es también una matriz permutación! Al¬ 
gebraicamente es tan sencillo, mandar (x, y) a (y, x), que la repre¬ 
sentación geométrica se ocultó. 




4. Una matriz proyección transforma todo el espacio en un subespa¬ 
cio de dimensión inferior (no invertible). El ejemplo transforma 
cada vector (x, y) en el plano hasta el punto más próximo (x, 0) 
sobre el eje horizontal. Este eje es el espacio columna de A. El eje 
y que proyecta a (0, 0) es el espacio nulo. 



alargamiento rotación de 90° reflexión (espejo a 45°) proyección sobre el eje 


Figura 2.9 Transformaciones del plano realizadas por cuatro matrices. 
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Estos ejemplos pudieron presentarse en tres dimensiones. Hay matrices para alargar la 
Tierra, hacerla girar o reflejarla a través del plano del ecuador (el Polo Norte se 
en el Polo Sur). Hay una matriz que proyecta todo sobre ese plano (ambos polos al centro). 
También es importante reconocer que las matrices no pueden hacer todo, y que algunas 
transformaciones T(x) no son posibles con Ax. 

i) Es imposible mover el origen, ya que AO = 0 para toda matriz. 

ii) Si el vector x se va en x', entonces 2x debe irse en 2x'. En general, ex debe irse en ex , 

ya que A(cx) = c(Ax). , . , , » 

iii) Si los vectores x y y se van en x' y y', entonces su suma x + y se debe ir en x +y, 

ya que A(x + y) — Ax + Ay. 


La multiplicación de matrices impone estas reglas sobre la transformación. La segunda re¬ 
gla contiene a la primera (tome c = 0 para obtener AO = 0). La regla m) se vio en acción 
cuando (4, 0) se reflejó a través de la recta a 45° Se separo en (2, 2) + (2, -2) y ambas 
partes fueron reflejadas por separado. Lo mismo puede hacerse para las proyecciones, se¬ 
parar, proyectar por separado, y sumar las proyecciones. Estas reglas son validas para cual¬ 
quier transformación que provenga de una matriz. 

Esta importancia les ha ganado una denominación: las transformaciones que cumplen 
las reglas i) a iii) se denominan transformaciones lineales. Las reglas pueden combinarse 
en un requerimiento: 


2T Para todos los números c y d y todos los vectores x y 
matrices satisface la regla de linealidad: 

A (ex + dy) = c(Ax) + ¿(Ay) 

Toda transformación Jpc) que campte ..este requorimiento es una 
lineal. 



Cualquier matriz lleva de inmediato a una transformación lineal. La pregunta mas intere¬ 
sante es en la dirección opuesta: iToda transformación lineal lleva a una maínz. El obje¬ 
tivo de esta sección es encontrar la respuesta: sí. Este es el fundamento de un método del 
álgebra lineal -empezar con la propiedad 1) y desarrollar sus consecuencias—; esto es 
mucho más abstracto que el método más importante de este libro. Aquí se eligió empezar 
directamente con matrices, y a continuación se verá cómo representan transformaciones li- 

neales 

Una transformación no necesita ir de R" al mismo espacio R". Se permite absolutamen¬ 
te transformar vectores en R" en vectores en otro espacio distinto R m ¡Esto es exactamen¬ 
te lo que hace una matriz de m por ni El vector original x tiene n componentes, y el vector 
transformado Ax tiene m componentes. La regla de linealidad la cumplen igualmente las ma¬ 
trices rectangulares, de modo que éstas también producen transformaciones lineales. 

A estas alturas del libro, no hay razón para detenerse. Las operaciones sobre la condi¬ 
ción de linealidad 1) son la suma y la multiplicación por un escalar, aunque x y y no nece¬ 
sitan ser vectores columna en R". Éstos no son los únicos espacios. Por ^definición, 
cualquier espacio vectorial permite las combinaciones ex + dy, los “vectores son x y y, 
aunque en realidad pueden ser polinomios, matrices o funciones x(í) y y(í). En la medida 
en que la transformación cumpla la ecuación 1), es lineal. 

Como ejemplos se toman los espacios P„, donde los vectores son polinomios p(t) de 
grado n. Se denotan como p = a 0 + a x t + •• • + y la dimensión del espacio vecton 
e S n + 1 (debido a que con el término constante, hay n + 1 coeficientes). 
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Ejemplo 1 La operación de diferenciación, A = d/dt, es lineal: 

Ap(f) = —(«o + ari + • • • + a„t n ) = a¡_ + • • • + na n t n ~~ x . (2) 

dt 

El espacio nulo de esta A es el espacio unidimensional de constantes: da 0 /dt = 0. El espa¬ 
cio columna es el espacio «-dimensional P„_ t ; el miembro derecho de la ecuación (2) 
siempre está en ese espacio. La suma de la nulidad (= 1) y el rango (= n) es la dimensión 
del espacio original P„. 

Ejemplo 2 La integración desde 0 hasta t también es lineal (lleva P n a P„ +1 ): 

Ap(t) = / (do + • • • + a n t n ) dt = üqí + • • • +—f" +1 . (3) 

Jo n + 1 

Esta vez no hay espacio nulo (¡excepto por el vector cero, como siempre!) pero la integra¬ 
ción no produce todos los polinomios en P n+l . El miembro derecho de la ecuación (3) no 
tiene término constante. Probablemente los polinomios constantes sean el espacio nulo iz¬ 
quierdo. 

Ejemplo 3 La multiplicación por un polinomio fijo como 2 + 3f es lineal: 

Ap(t) = (2 + 3f)(do + • • * + a n t n ) = 2do + • • • + 3 a n t n+x . 

De nuevo, esto transforma P„ en P„ +1 , sin espacio nulo excepto p — 0. 

En estos ejemplos (y en casi todos los ejemplos), no es difícil comprobar la linealidad. 
Incluso, difícilmente parece interesante hacerlo. Si hay linealidad, prácticamente es impo¬ 
sible ignorarla. A pesar de ello, se trata de la propiedad más importante que puede tener una 
transformación.* Por supuesto, la mayor parte de las transformaciones no son lineales: por 
ejemplo, para elevar al cuadrado al polinomio (Ap = p 2 ), o sumar 1 (Ap = p + 1), o pre¬ 
servar los coeficientes positivos ( A(t — í 2 ) = t). Son las transformaciones lineales, y sólo 
éstas, lo que lleva a las matrices. 


Transformaciones representadas por matrices 

La linealidad tiene una consecuencia crucial: Si se conoce Ax para cada vector en una ba¬ 
se, entonces se conoce Ax para cada vector en todo el espacio. Suponga que esta base 
consta de los n vectores x l; . . ■ , x n . Cualquier otro vector x es una combinación de estos 
vectores particulares (generan el espacio). Así, la linealidad determina Ax: 

Linealidad si x = cqxi + • • • + c n x„ entonces Ax = c^AxO + • • • + c„(Ax„). (4) 

Una vez que la transformación T(x ) = Ax ha decidido qué hacer con los vectores de la ba¬ 
se, ya no tiene libertad disponible. El resto es determinado por la linealidad. El requeri¬ 
miento 1) para dos vectores x y y lleva a la condición 4) para n vectores x lt , x n . La 
transformación tiene manos libres con los vectores en la base (son independientes). Una 
vez que éstos se establecen, también se establece la transformación de cada vector. 


*En orden de importancia, quizá en segundo lugar esté la invertibilidad. 
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Ejemplo 4 


¿Qué transformación lineal lleva x x y x-¡_ a Ax x y Ax 2 ? 


■i! 2 

se va en Ax¡ = 3 ; 

-J 4 


se va en Ax 2 = 6 . 

.P 8 


Debe ser la multiplicación T(x) = Ax por la matriz 


2 4 

3 6 . 

4 8 


Empezando con una base distinta (1, 1) y (2, — 1), esta misma A también es la única trans¬ 
formación lineal con 


*&-[¿\ y 

Luego se encuentran matrices que representan diferenciación e integración. Primero 
debe decidirse sobre una base. Para los polinomios de grado 3 hay una elección natural 
para los cuatro vectores de la base: 

Base de P 3 p x — 1, p 2 = f, p 3 = t 2 , p A = í 3 . 

Esta base no es única (nunca lo es), pero se requiere de una elección, y ésta es la más con¬ 
veniente. Las derivadas de estos cuatro vectores de la base son 0, 1, 2 1, 3f 2 : 

Acción ded/dt Ap x = 0, Ap 2 = p x , Ap 3 = 2 p 2 , Ap 4 = 3p 3 . (5) 


más con- 


“d/df actúa de inmediato exactamente como una matriz, pero ¿cuál matriz? Suponga que 
se está trabajando en el espacio tetradimensional de costumbre con la base de costumbre, 
los vectores de coordenadas p¡ = (1, 0, 0, 0 ),p 2 = (0, 1, 0, 0), p 3 = (0, 0, 1, 0), p A = (0, 
0, 0, 1). La matriz es decidida por la ecuación (5): 


Matriz diferenciación 


0 10 0 ' 

0 0 2 0 

Aiií 0 0 0 3' 
0 0 0 0 


Ap x es su primera columna, que es cero. Ap z es la segunda columna, que es p x . Ap 3 es 2 p 2 , 
y Áp A es 3p 3 . El espacio nulo contiene a p x (la derivada de una constante es cero). El espa¬ 
cio columna contiene a p x , p 2 , p 3 (la derivada de una cúbica es una cuadrática). La deriva¬ 
da de una combinación como p = 2 + t- t z -P es decidida por la linealidad, y no hay 
nada nuevo en eso: es la forma en que todos diferenciamos. Sería absurdo memorizar la de¬ 
rivada de cada polinomio. 

La matriz puede diferenciar este p(t), ¡porque las matrices incluyen linealidad! 


"0 1 0 0] r 2 

dp_ 0 0 2 0 1 

dt Ap ~~ > 0 0 0 3 -1 

0 0 0 Oj [-i 
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En breve, la matriz contiene toda la información esencial. Si se conoce la base, y se cono¬ 
ce la matriz, entonces se conoce la transformación de cada vector. 

La codificación de la información es sencilla. Para transformar un espacio en sí mis¬ 
mo, basta una base. Una transformación de un espacio en otro requiere una base para cada 
espacio. 



2U Suponga que los vectores x x ,... ,x n son una base del esp: 
tores y x ,. . ., y m son una base de W. Cada transformación lint 
presentada por una matriz A. Lay-ésima columna se encuentra a 
vector .t, de la base, y escribiendo T{xf) como una combinador 

Columna j de A T(xj) = Axj = a^yi + a 2 jy 2 + 


Para la matriz diferenciación, la columna 1 provino del primer vector de la base, 
p x — 1. Su derivada es cero, de modo que la columna 1 es cero. La última columna provi¬ 
no de ( d/dt)t 3 = 3Z 2 . Debido a que 3 1 2 = 0p x + 0 p 2 + 3p 3 + 0p 4 , la última columna con¬ 
tenía a 0, 0, 3, 0. La regla (6) construye la matriz, columna por columna. 

Para la integración se hace lo mismo. Ahí se va de cúbicas a cuárticas, transformando 
V = P 3 en W = P 4 , por lo que se requiere una base de W. La elección natural es y¡ = 1, 
y 2 ~ y 3 — í 2 - = f 3 . y 5 = ?4 > generando los polinomios de grado 4. La matriz A es de m 

por n, o de 5 por 4. Proviene de la aplicación de la integración a cada vector de la base de 
V: 



o bien, Ax j — y 2 . 


.... f. 


o bien, Ax a = -y 5 . 


‘0 0 0 0 ’ 

10 0 0 

Matriz integración A in[ = 0 | 0 0 . 

0 0 i 0 

P00|. 

La diferenciación y la integración son operaciones inversas. O por lo menos la integradón 
seguida de la diferenciación regresa a la función original. Para hacer que esto ocurra para 
las matrices, se requiere la matriz diferenciación de cuárticas a cúbicas, que es de 4 por 5: 


0 

1 

0 

0 

0] 

‘1 

0 

0 

2 

0 

0 . . 

1 

0 

0 

0 

3 

II 

c 

‘■0 

< 

O 

1 

0 

0 

0 

0 

4J 

1 


La diferenciación es una inversa izquierda de la integración. ¡Las matrices rectangulares 
no pueden tener inversas por ambos lados! En el orden opuesto, AjntAdif = / no puede ser 
cierto. El producto de 5 por 5 tiene ceros en su columna 1. La derivada de una constante 
es cero. En las otras columnas A int A dif es la identidad, y la integral de la derivada de t n 
es f 1 . 
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Rotaciones O, proyecciones P y reflexiones H 

Esta sección empieza con rotaciones de 90°, proyecciones sobre el eje x, y reflexiones a 
través de la recta a 45°. Sus matrices son especialmente sencillas: 




0 ' 

0 


H = 


1 ' 

0 ' 


(rotación) (proyección) (reflexión) 


Las transformaciones lineales subyacentes del plano x-y también son sencillas. Sin embar¬ 
go, las rotaciones a través de otros ángulos, las proyecciones sobre otras rectas, y las refle¬ 
xiones en otros espejos son casi tan fáciles de visualizar. Siguen siendo transformaciones 
lineales, suponiendo que el origen esté fijo: A0 = 0. Deben estar representadas por matri¬ 
ces. Usando la base natural [‘] y [®], se desea descubrir estas matrices. 


1, Rotación En la figura 2.10 se muestra la rotación de un ángulo 9. También muestra 
el efecto sobre los dos vectores de la base. La primera va a (eos 9, sen 6), cuya longitud si¬ 
gue siendo 1; está en la “recta 9”. El segundo vector base (0, 1) rota en (- sen 9, eos 9). Por 
la regla (6), estos números van a las columnas de la matriz (se usa c para eos 9 y s para sen 
9). Esta familia de rotaciones Q g constituye una oportunidad perfecta para probar la corres¬ 
pondencia entre las transformaciones y las matrices: 

¿La inversa de O e es igual aQ- & (rotación hacia atrás por un ángulo 6>)? Sí. 


QeQ-e ~ 




¿El cuadrado de Q & es igual a Q 2B (rotación por un ángulo doble)? Sí. 


' c —^j ' c — s ~ c 2 — s 2 —les _ eos 19 —sen 29 
s c s c ~ 2 es c 2 — s 2 sen 29 eos 20 


¿El producto de Q e y Q v es igual a Q e+(f (rotación por un ángulo 9 y luego <p)? Sí. 


Qb Q¡p 


eos 9 c-os (p — sen 0 sen (p 
sen 9 eos <p + eos 9 sen ip 


eos {9 + <p) ■ ■ ■ ■ 
sen (9 + (p) ■ ■ ■ ■ 



Figura 2.10 Rotación en un ángulo 9 (izquierda). Proyección sobre la recta 9 (derecha). 
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El último caso contiene a los dos primeros. La inversa aparece cuando ip es —9, y el cua¬ 
drado aparece cuando cp es + 9. Estas tres ecuaciones fueron decididas por identidades tri¬ 
gonométricas (y constituyen una nueva manera de recordar estas identidades). No es 
accidental que la respuesta a las tres preguntas sea sí. La multiplicación de matrices se de¬ 
fine exactamente de modo que el producto de las matrices corresponda al producto de las 
transformaciones. 

2V Suponga que A y iS son transfomiaciones lineales de y a W y deTJ a V. Su pro¬ 
ducto AB empieza con un vector u en U, va a Bu en V, y termina con A Bu en W. Es¬ 
ta “composición” AB de nuevo es una transformación lineal (de L a W). Su matriz 
es el producto de las matrices individuales que representan A y B. 

Para A dif A jnt , la transformación compuesta era la identidad (y A^ A djf aniquilaron a 
todas las constantes). Para rotaciones, el orden de la multiplicación no importa. Así, U = 
V = W es el plano x-y, y Q e Q lp es lo mismo que Q,/2o- Para una rotación y una refle¬ 
xión, el orden sí es importante. 

Nota técnica : Para construir las matrices, se requieren bases de V y W, y luego para U y 
V. Al mantener la misma base para V, el producto de matrices va correctamente de la ba¬ 
se en U a la base en W. Si la transformación A se distingue de su matriz (sea ésta [A]), en¬ 
tonces la regla del producto 2V se vuelve extremadamente concisa: [AB] = [A] [B], La regla 
para multiplicar matrices, en el capítulo 1 estaba totalmente determinada por este requeri¬ 
miento: debe corresponder al producto de transformaciones lineales. 

2. Proyección En la figura 2.10 también se muestra la proyección de (1, 0) sobre la recta 
9. La longitud de la proyección es c = eos 9. Observe que el punto de proyección no es (c, 
s), como yo consideraba erróneamente; la longitud de ese vector es 1 (es la rotación), de 
modo que es necesario multiplicar por c. De manera semejante, la longitud de la proyec¬ 
ción de (0, 1) es j, y cae en s(c, s ) = (es, s 2 ). Así se obtiene la segunda columna de la ma¬ 
triz proyección P: 

Proyección sobre la recta 0 p — 

Esta matriz no tiene inversa, porque la transformación no tiene inversa. Los puntos sobre 
la recta perpendicular son proyectados sobre el origen; esa recta es el espacio nulo de P. 
¡Los puntos sobre la recta 9 son proyectados sobre sí mismos! Proyectar dos veces es lo 
mismo que proyectar una vez, y P 2 = P: 

p 2 _ c 2 es 2 _ c z (c 2 + s 2 ) cs(c 2 + S 2 ) _ p 

es s 2 cs(c 2 + J 2 ) s 2 (c 2 + s 2 ) 

Por supuesto, c 2 + s 2 = eos 2 9 + sen 2 9=1. Una matriz, proyección es igual a su propio 
cuadrado. 

3. Reflexión En la figura 2.11 se muestra la reflexión de (1, 0) en la recta 9. La longitud 
de la reflexión es igual a la longitud del original, como era después de la rotación; sin em¬ 
bargo, en este caso la recta 9 permanece donde está. La recta perpendicular invierte la direc¬ 
ción; todos los puntos pasan directamente a través del espejo. La linealidad decide el resto. 

Matriz reflexión H = 


2 c 2 — 1 2 es 

2 es 2 s 2 — 1 
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Figura 2.11 Reflexión a través de la recta 9: geometría y matriz. 


La matriz H posee la extraordinaria propiedad H 2 - I. Dos reflexiones devuelven el origi¬ 
nal. Una reflexión es su propia inversa, H=H~ l , lo cual resulta evidente a partir de la geo¬ 
metría pero es menos evidente a partir de la matriz. Un método es a través de larelacion 
de las reflexiones con las proyecciones: H = 2P - /. Esto significa que Hx + x = 2 Px: la 
imagen más el original es igual a dos veces la proyección. También confirma que H - I: 

H 2 = (2 P - I ) 2 = 4 P 2 - 4 P + I = I, ya que P 2 = P . 


Otras transformaciones Ax pueden incrementar la longitud de x; el alargamiento y el 
esfuerzo cortante se encuentran en los ejercicios. Cada ejemplo tiene una matriz que lo re¬ 
presenta, lo cual constituye la cuestión más importante de esta sección. Sin embargo, tam¬ 
bién está la cuestión de elegir una base, y se recalca que la matriz depende de la elección 
de la base. Suponga que el primer vector en la base está sobre la recta 6 y que el segundo 
vector en la base es perpendicular: 

i) La matriz proyección es regresada por R = [o o] • ® sta matr * z se constru y e como 
siempre: su primera columna proviene del primer vector en la base (proyectado en 
sí mismo). La segunda columna proviene del vector en la base que es proyectado en 
cero. 

ii) Para reflexiones, esa misma base proporciona H = _°j .El segundo vector en la 

base es reflejado sobre su negativo para producir esta segunda columna. La matriz H 
sigue siendo 2 P — / cuando la misma base se usa para H y P. 


iii) Para rotaciones, la matriz no cambia. Estas rectas siguen rotando un ángulo 9, y 
q = I”' como antes. 


Toda la cuestión de elegir la mejor base es absolutamente fundamental, por lo que en el ca¬ 
pítulo 5 se abordará nuevamente. El objetivo es hacer diagonal a la matriz, como se logró 
para Py H. Para hacer diagonal a Q se requieren vectores complejos, ya que todos los vec¬ 
tores reales están rotados. 

Aquí se menciona el efecto que tiene sobre la matriz un cambio de base , mientras las 
transformaciones lineales permanecen igual. La matriz A (o Q, o P, o H) se modifica a 
S~*AS. Así, una simple transformación es representada por varias matrices (mediante ba¬ 
ses diferentes, tomadas en cuenta por 5). La teoría de los vectores característicos conduce 
a la fórmula S~ l AS, así como a la mejor base. 
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Conjunto de problemas 2.6 

1. ¿Qué matriz tiene el efecto de rotar cada vector un ángulo de 90° y luego proyectar el 
resultado sobre el eje x? ¿Qué matriz representa la proyección sobre el eje x seguida 
de la proyección sobre el eje y? 

2. El producto de 5 reflexiones y 8 rotaciones del plano x-y, ¿produce una rotación o una 
reflexión? 

3. La matriz A = j"g ° J produce un alargamiento en la dirección x. Trace el círculo 

x 2 + y 2 = 1 y a su alrededor trace los puntos (2x, y) que resultan de la multiplicación 
por A. ¿Qué forma tiene esa curva? 

4. Toda recta sigue siendo recta después de una transformación lineal. Si z está a la mi¬ 
tad entre x y y, demuestre que Az está a la mitad entre Ax y Ay. 

5. La matriz A — |j j 1 ] produce una transformación por esfuerzo cortante, que deja el 

eje y sin cambio. Bosqueje este efecto en el eje x, indicando lo que ocurre a (1, 0) y 
(2, 0) y ( — 1, 0), y cómo se transforma todo el eje. 

6 . ¿Cuáles son las matrices de 3 por 3 que representan las transformaciones que 

a) proyectan cada vector sobre el plano x-y? 

b) reflejan cada vector a través del plano x-y? 

c) rotan el plano x-y un ángulo de 90°, dejando sólo al eje z? 

d) rotan un ángulo de 90° al plano x-y, luego al plano x-z, y luego al plano y-z? 

e ) realizan las tres rotaciones, pero cada una de un ángulo de 180 o ? 

7. En el espacio P 3 de polinomios cúbicos, ¿qué matriz representa d 2 /dt 2 l Construya la 
matriz de 4 por 4 a partir de la base estándar 1, t, t 2 , t 3 . Encuentre su espacio nulo y su 
espacio columna. ¿Qué significan éstos en términos de polinomios? 

8 . De los cúbicos P 3 hasta los polinomios de cuarto grado P 4 , ¿qué matriz representa la 
multiplicación por 2 4- 3í? Las columnas de la matriz A de 5 por 4 provienen de la 
aplicación de la transformación a l,í, í 2 , r 3 . 

9 . Las soluciones de la ecuación diferencial d 2 u/dt 2 = u forman un espacio vectorial (ya 
que las combinaciones de soluciones siguen siendo soluciones). Encuentre dos solu¬ 
ciones independientes, con la finalidad de obtener una base para ese espacio solución. 

10. Con valores iniciales u = x y du/dt = y en t = 0, ¿qué combinación de los vectores 
en la base del problema 9 resuelve «" = «? Esta transformación de valores iniciales a 
solución es lineal. ¿Cuál es su matriz de 2 por 2 (usando x = l,y = 0yx = 0, y = 1 
como base de V, y su base de W)? 

11. Compruebe directamente a partir de c 2 + s 2 = 1 que las matrices reflexión satisfacen 

fP = I. 

12. Suponga que A es una transformación lineal del plano x-y en sí mismo. ¿Qué hace 
A"’(x + y) = A -I x + A~’y ? Si A está representada por la matriz M, explique por 

qué A ~ 1 está representada por M ~ 1 . 

13. El producto ( AE)C de transformaciones lineales empieza con un vector x y produce 
u = Cx. Luego, la regla 2V aplica AB a u y llega a ( AB)Cx. 
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a) ¿Este resultado es el mismo si se aplican por separado C, luego B y por último A? 

b) ¿Este resultado es el mismo si se aplica BC seguido de A? Los paréntesis son inne¬ 
cesarios y la ley asociativa ( AB)C = A(BC) se cumple para transformaciones linea¬ 
les. Esta es la mejor demostración de la misma ley para matrices. 

14. Demuestre que T 2 es una transformación lineal si T es lineal (de R 3 a R 3 j. 

15. El espacio de todas las matrices de 2 por 2 tiene los cuatro “vectores en la base 

'1 0] [0 ll [0 Ol [0 0' 

0 0J ’ [0 0J ’ [l Oj ’ |o ’ 

Para la transformación lineal de trasposición, encuentre su matriz A respecto a esta ba¬ 
se. ¿Por qué A 2 = /? 

16. Encuentre la matriz permutación cíclica de 4 por 4: (x ls x 2 , x 3 ,x 4 ) se^transforma en 
Ax = (x 2 , x 3 , x 4 , x t ). ¿Cuál es el efecto de A 2 ? Demuestre que A = A . 

17 Encuentre la matriz A de 4 por 3 que representa un desplazamiento derecho : (r b x 2 , 
xj) se transforma en (0, x„ x 2 , x 3 ). También encuentre la matriz desplazamiento iz¬ 
quierdo B de R 4 de regreso a R 3 , transformando (x, . x 2 , x 3 , x 4 ) en (x 2 , x 3 , x 4 ). ¿Cuáles 
son los productos AB y B A? 

18. En el espacio vectorial P 3 de todos los pix) = a 0 + a x x + a 2 x 2 + a 3 x 3 , sea S el sub¬ 
conjunto de los polinomios con f 0 ' p(x) dx = 0. Compruebe que S es un subespacio 
y encuentre una base. 

19. Una transformación no lineal es invertible si T(x) = b tiene exactamente una solución 
para toda b. El ejemplo si T(x) = x 2 no es invertible porque x 2 = b tiene dos solucio¬ 
nes para b positiva y ninguna solución para b negativa. ¿Cuáles de las siguientes trans¬ 
formaciones (de los números reales R 1 a los números reales R 1 ) son invertibles? 
Ninguna es lineal, ni siquiera c). 

a) T(x) = x 3 . b) T(x)=e\ 

c) T(x) = x + 11. d) T(x) = cosx. 

20. ¿Cuál es el eje y el ángulo de rotación para la transformación que lleva (xj, x 2 , x 3 ) a 
(x 2 , X 3 , Xi)? 

21. Una transformación lineal debe dejar fijo ai vector cero: T( 0) = 0. Demuestre esto a 

partir de T(v + w) = Tiv) + T(w) escogiendo w = -. También demuéstrelo a par¬ 
tir del requerimiento T(cv ) = cT(v) escogiendo c =-. 

22. ¿C uále s de las siguientes transformaciones no son lineales? La entrada es v = (v u v 2 ). 

a) T(v)=(v 2 ,v i). b ) T(u) = (i>i,ui). 

c) T(v) = (0,u,). d) T(v)=( 0,1). 

23. Si S y T son lineales con S{v) = Tiv) = u, entonces ¿ S(T(v )) = »o« 2 ? 

24. Suponga que T(v) = v, excepto que 7X0, v 2 ) — (0, 0). Demuestre que esta transforma¬ 
ción satisface T(cv) = cT(v ) pero no T{v + w) = Tiv) + T(w). 

25. ¿Cuáles de las siguientes transformaciones satisfacen Tiv + w) = Tiv) + T(w), y cuá¬ 
les satisfacen T{cv ) = cT(u)? 

a) T{v) = v/\\v\\. b) T(v) = V! + v 2 + v 3 . 

c) T(v)=(v ¡,2v 2 ,3v 3 ). d) T(v) — la mayor componente de v. 


0 i 1 7 3 8 
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26. Para las siguientes transformaciones de V = R 2 en W = R 2 , encuentre T(T(v)). 

a) T{v) = —u. 

b) Tiv) = v +(1,1). 

c) T{v) = 90° rotación = (—u 2 , iq). 

- , (V\ + V 2 Vi + V 2 

d) Tiv) = proyección = ^———, ——— 

27. La transformación “cíclica” T se define por Tiv,, v 7 , v 3 ) = (v 7 , v 3 , v,). /Cuál es 
T(TiTiv)))? ¿Cuál es r IOO (u)? 

28. Encuentre el contradominio y el kemel (estos términos son nuevos para designar el es¬ 
pacio columna y el espacio nulo) de T. 

a) Tivi, v 2 ) = iv 2 ,vi). b ) Tiv ¡,v 2 ,v 3 ) = ivi,v 2 ). 

c) Tiv u v 2 ) = (0,0). d) Tiv u v 2 ) = (ui.ui). 

29. Una transformación lineal de V a W tiene una inversa de W a V cuando el contrado¬ 
minio es todo W y el kemel sólo contiene a v = 0. ¿Por qué estas transformaciones 
no son invertibles? 

d) Tiv¡,v 2 ) =iv 2 ,v 2 ) W = R 2 . 

ti) Tiv u v 2 ) = (tti,i) 2 ,ui +v 2 ) W = R 3 . 
c) Tiv ,,v 2 )=v, W = R 1 . 

30. Suponga que una T lineal transforma (1, 1) en (2, 2) y (2, 0) en (0, 0). Encuentre Tiv) 
cuando 

a) v= (2, 2). b) v = (3, 1). c) v = ( — 1, 1). d) v = (a,b). 

Los problemas 31 a 35 pueden ser más difíciles. El espacio de entrada V contiene a to¬ 
das las matrices M de 2 por 2. 

31. M es cualquier matriz de 2 por 2yA=jj 4 j-La transformación lineal T se define 

como TiM) = AM. ¿Cuáles reglas de la multiplicación de matrices muestran que T es 
lineal? 

32. Suponga que A = j^ 3 g j. Demuestre que la matriz identidad I no está en el contra¬ 
dominio de T. Encuentre una matriz M diferente de cero tal que 77Af) = AM es cero. 

33. Suponga que T transpone a toda matriz M. Intente encontrar una matriz A que haga 
AA¡f = M t para toda M. Demuestre que ninguna matriz A puede hacer lo anterior. Pa¬ 
ra los profesores: ¿Esta es una transformación lineal que no proviene de una matriz? 

34. La transformación T que transpone a toda matriz es definitivamente lineal. ¿Cuáles de 
las siguientes propiedades adicionales son ciertas? 

a) T 2 = transformación identidad. 

. ti) El kemel de T es la matriz cero. 

c) Todas las matrices están en el contradominio de T. 

d) TiM) = —M es imposible. 

35. Suponga que T(M) = °] [^] [o i]- Encuentre una matriz con T(M) # 0. 

Describa todas las matrices con T(M) = 0 (el kemel de I) y todas las matrices de sa¬ 
lida TiM) (el contradominio de T). 
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Los problemas 36 a 40 son sobre cambio de base. 

36. a) ¿Qué matriz transforma (1, 0) en (2, 5) y (0, 1) en (1, 3)? 

tí) ¿Qué matriz transforma (2, 5) en (1, 0) y (1, 3) en (0, 1)? 

c) ¿Por qué ninguna matriz transforma (2, 6) en (1, 0) y (1, 3) en (0, 1)? 

37. a) ¿Qué matriz M transforma (1, 0) y (0, 1) en (r, í) y ( s, «)? 

tí) ¿Qué matriz N transforma (a, c) y (tí, d) en (1, 0) y (0, 1)? 

c) ¿Qué condición sobre a, b, c, d hace imposible el inciso tí)? 

38. a) ¿Cómo M y N del problema 37 producen una matriz que transforma (a, c ) en ( r , i) 

y ( b , d) en ( s, u)2 

tí) ¿Qué matriz transforma (2, 5) en (1, 1) y (1, 3) en (0, 2)? 

39. Si se conservan los mismos vectores en la base pero se escriben en otro orden, la ma¬ 
triz de cambio de base M es una matriz_. Si los vectores en la base se preservan 

en orden pero se cambian sus longitudes, entonces M es una matriz_. 

40. La matriz que transforma (1, 0) y (0, 1) en (1, 4) y (1, 5) es M — _. La combina¬ 

ción a(l, 4) + b{\, 5) igual a (1, 0) tiene (a, &) = (,). ¿Cómo se relacionan estas coor¬ 
denadas de (1, 0) con M o M~ l ? 

41. ¿Cuáles son las tres ecuaciones para A, B, C si la parábola Y = A + Bx + Cx 2 es igual 
a 4 en x = a, 5 en x = b, y 6 en x = c? Encuentre el determinante de la matriz de 3 
por 3. ¿Para qué números a, b, c es imposible encontrar esta parábola Y? 

42. Suponga que iq, v 2 , v 3 son vectores característicos para T. Esto significa que T(v : ) = 
X¡Vi para i — 1, 2, 3. ¿Cuál es la matriz para T cuando las bases de entrada y de salida 
son las us? 

43. Toda transformación lineal invertible puede tener a / como su matriz. Para la base de 
salida se elige w¡ = T(v¡). ¿Por qué T debe ser invertible? 

44. Suponga que T es una reflexión a través del eje x y que S es una reflexión a través del 
eje y. El dominio V es el plano x-y. Si v = (x, y), ¿cuál es S(T(v))? Encuentre una des¬ 
cripción más sencilla del producto ST. 

45. Suponga que T es una reflexión a través de la recta a 45°, y que S es una reflexión a 
través del eje y. Si v = (2, 1), entonces T(v) = (1,2). Encuentre S(T(v)> y T(S(v)). Con 
esto se demuestra que en general ST i= TS. 

46. Demuestre que el producto ST de dos reflexiones es una rotación. Multiplique estas 
matrices reflexión para encontrar el ángulo de rotación: 


eos 29 

sen 2 9 

eos 2a 

sen 2a 

sen 2 9 

—eos 20 

sen 2o; 

—eos 2a 


47. La matriz de Hadamard de 4 por 4 está integrada completamente por +1 y — 1: 



Encuentre H 1 y escriba v = (7, 5, 3, 1) como una combinación de las columnas de H. 

48. Suponga que se tienen dos bases iq,.... v n y uq,..., w„ de R". Si un vector tiene coe¬ 
ficientes b¡ en una base y c¡ en la otra base, ¿cuál es la matriz de cambio de base en 
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d = Me? Empiece con ~ - - nep. ahgeutína 

¿qiq + ■ • • A-b n v n = Vb — c iuq + • • • +c n w n = Wc. 

Su respuesta representa T(v) = v con base de entrada de vs y base de salida de ws. De¬ 
bido a que las bases son distintas, la matriz no es I. 

49. ¿Falso o verdadero? Si se conoce T(v) para n vectores diferentes de cero en R n , enton¬ 
ces se conoce T(v) para cada vector en R". 

50. (Recomendado) Suponga que todos los vectores x en el cuadrado unitario 0 x¡ £ 1, 
0 £ q < 1 se transforman en Ax (A es de 2 por 2). 

a) ¿Cuál es la forma de la región transformada (toda Ax)? 

b) ¿Para qué matrices A esta región es cuadrada? 

c) ¿Para qué matrices A es una recta? 

d) ¿Para qué matrices A la nueva área sigue siendo 1 ? 


Capítulo fS^É Ejercicios de repaso 

2.1 Encuentre una base para los siguientes subespacios de R 4 : 
a) Los vectores para los cuales x t = 2x 4 . 

tí) Los vectores para los cuales xq + x 2 + x 3 = 0 y x 3 + x 4 = 0. 
c) El subespacio generado por (1, 1, 1, 1), (1, 2, 3, 4), y (2, 3, 4, 5). 

2.2 Proporcione una base para describir un subespacio bidimensional de R 3 que no con¬ 
tenga ninguno de los vectores de coordenadas (1,0, 0), (0, 1, 0), (0, 0, 1). 

2.3 ¿Falso o verdadero? Proporcione un contraejemplo si es falso: 

a) Si los vectores x, . x m generan un subespacio S, entonces dim S — m. 

b) La intersección de dos subespacios de un espacio vectorial no puede ser vacía. 

c ) Si Ax = Ay, entonces x = y. 

d) El espacio renglón de A tiene una base única que puede calcularse reduciendo A 
a forma escalonada. 

e) Si una matriz cuadrada A tiene columnas independientes, también A 2 tiene co¬ 
lumnas independientes. 

2.4 ¿Cuál es la forma escalonada U de A? 

' 1 2 0 2 1 ' 

A = -1 -2 1 1 0 . 

1 2-3-7 —2_ 

¿Cuáles son las dimensiones de sus cuatro subespacios fundamentales? 

2.5 Encuentre el rango y el espacio nulo de 


0 

0 

T 

r° 

0 

1 

2 

0 

0 

1 

y B — 0 

0 

1 

2 

1 

1 

l 

[1 

1 

1 

0 
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2.6 Encuentre bases para los cuatro subespacios fundamentales asociados con 

n 2i ro oí „ ri i o oí 


0 10 1 ' 


2.7 ¿Cuál es la solución más general de n + u + w = l, u — w = 2? 

2.8 a) Construya una matriz cuyo espacio nulo contenga al vector x = (1, 1,2). 

tí) Construya una matriz cuyo espacio nulo izquierdo contenga a y = (1,5). 

c) Construya una matriz cuyo espacio columna sea generado por (1, 1, 2) y cuyo 
espacio renglón sea generado por (1, 5). 

d) Si se tienen tres vectores cualesquiera en R 6 y tres vectores cualesquiera en R 3 , 
¿existe alguna matriz de 6 por 5 cuyo espacio columna es generado por los pri¬ 
meros tres y cuyo espacio renglón es generado por los segundos tres? 


2.9 En el espacio vectorial de matrices de 2 por 2, 

a) ¿el conjunto de matrices con rango 1 es un subespacio? 
tí) ¿qué subespacio es generado por las matrices permutación? 

c) ¿qué subespacio es generado por las matrices positivas (todos los ay > 0)? 

d ) ¿qué subespacio es generado por las matrices invertibles? 

2.10 Invente un espacio vectorial que contenga a todas las transformaciones lineales de 
R" a R". Defina una regla para la suma. ¿Cuál es la dimensión del espacio vecto¬ 
rial? 


2.11 a) Encuentre el rango de A, y proporcione una base de su espacio nulo. 

'1 1 [1 2 0 1 2 f 

21 002200 
A LU 211 0 0 0 0 0 1 ' 
324 lj [0 00000 


b) Los 3 primeros renglones de U son una base del espacio renglón de A: ¿falso o 
verdadero? 

Las columnas 1, 3, 6 de U son una base del espacio columna de A: ¿falso o ver¬ 
dadero? 

Los cuatro renglones de A son una base del espacio renglón de A: ¿falso o ver¬ 
dadero? 

c) Encuentre tantos vectores b linealmente independientes como sea posible para 
los cuales Ajc = b tenga una solución. 

d) En la eliminación sobre A, ¿qué múltiplo del tercer renglón se restó para elimi¬ 
nar el cuarto renglón? 

2.12 Si A es una matriz de n por n — 1, y su rango es n — 2, ¿cuál es la dimensión de su 
espacio nulo? 

2.13 Use eliminación para encontrar los factores triangulares en A = LU, si 

a a a a 

, a b b b 
A = , 

a b c c 

a b c d 

¿Qué condiciones deben imponerse a los números a , b, c, d para que las columnas sean li¬ 
nealmente independientes? 
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1 



2.14 ¿Los vectores (1, 1, 3), (2, 3, 6), y (1, 4, 3) son una base de R 3 ? 

2.15 ¿Qué se sabe de C(A) cuando el número de soluciones de Ax = b es 
á) 0 o 1, dependiendo de b. 

tí) oo, independientemente de b. 

c) 0 o oo, dependiendo de b. 

d) 1, sin importar b. 

2.16 En el ejercicio anterior, ¿cómo está relacionado r con m y n en cada ejemplo? 

2.17 Si x es un vector en R”, y x T y = 0 para toda y, demuestre que x = 0. 

2.18 Si A es una matriz de n por n tal que A 2 = A y rango A — n, demuestre que A = I. 

2.19 ¿Qué subespacio de matrices de 3 por 3 es generado por las matrices elementales 
E¡j, con Is en la diagonal y cuando mucho un elemento diferente de cero debajo de 
la diagonal? 

2.20 ¿Cuántas matrices permutación de 5 por 5 hay? ¿Son linealmente independientes? 
¿Generan el espacio de todas las matrices de 5 por 5? No es necesario que las escri¬ 
ba todas. 

2.21 ¿Cuál es el rango de la matriz de n por n con todos los elementos igual al? ¿Qué 
puede decir sobre la “matriz de tablero de ajedrez”, con ay = 0 cuando i + j es par, 
üy = 1 cuando i + j es impar? 

2.22 a) ¿Qué condiciones deben imponerse a b para que Ax = b tenga una solución, pa¬ 

ra las siguientes Ay bl 

'1 2 0 3] \b{ 

A=0000 y b = b 2 . 

2 4 0 lj [ b~ 3 _ 

tí) Encuentre una base para el espacio nulo de A. 

c) Encuentre la solución general de Ax = b, cuando exista una solución. 

d) Encuentre una base para el espacio columna de A. 
é) ¿Cuál es el rango de A T ? 

2.23 ¿Cómo puede construirse una matriz que transforme los vectores de coordenadas e¡, 
e 2 , e 3 en tres vectores dados v u v 2 , v 3 ? ¿Cuándo es invertible esa matriz? 

2.24 Si e¡, e 2 , e 3 están en el espacio columna de una matriz de 3 por 5, ¿ésta tiene inver¬ 
sa izquierda? ¿Tiene inversa derecha? 

2.25 Suponga que T es una transformación lineal sobre R 3 que transforma cada punto (u, 
v, w) en (u + v + w, u + v, u). Describa lo que T~ l hace al punto (x, y, z). 

2.26 ¿Falso o verdadero ? 

a) Todo subespacio de R 4 es el espacio nulo de alguna matriz. 

tí) Si A tiene el mismo espacio nulo que A T , entonces la matriz debe ser cuadrada. 

c) La transformación que manda x a mx + b es lineal (de R 1 a R 1 ). 


2.27 Encuentre bases para los cuatro subespacios fundamentales de 


'1 2 0 3' 

0 2 2 2 

Al 0000 
0 0 0 4 
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2.28 a) Si los renglones de A son linealmente independientes (A es de m por n), entonces 

el rango es_, el espacio columna es_y el espacio nulo izquierda es_. 

b) Si A es de 8 por 10 con un espacio nulo bidimensional, demuestre que Ax — b 
puede resolverse para toda b. 


2.29 


2.30 


Describa las transformaciones lineales del plano x-y que están representadas con la 
base estándar (1, 0) y (0, 1) por las matrices 





a) Si A es cuadrada, demuestre que el espacio nulo de A 2 contiene al espacio nulo 
de A. 

b) También demuestre que el espacio columna de A 2 está contenido en el espacio 
columna de A. 


2.31 ¿Cuándo se cumple A 2 = 0 para la matriz A = uv T de rango 1? 

2.32 a) Encuentre una base para el espacio de todos los vectores en R 6 con x t + x 2 = 

*3 + *4 = X 5 + X 6 . 

tí) Encuentre una matriz cuyo espacio nulo sea ese subespacio. 

c ) Encuentre una matriz cuyo espacio columna sea ese subespacio. 

2.33 Suponga que las matrices PA — LU son 


'0 1 0 0] [0 0 1-3 2 

1 0 0 0 2 -1 4 2 1 

0001 4-29 14 

0 0 1 OJ [2 -1 5-1 5 


T 

0 

0 

0 


"2 

-1 

4 

2 

f 

0 

1 

0 

0 


0 

0 

1 

-3 

2 

1 

1 

1 

0 


0 

0 

0 

0 

2 

2 

1 

0 

1 


0 

0 

0 

0 

0 


a) ¿Cuál es el rango de A? 

b) ¿Cuál es una base para el espacio renglón de A? 

c) ¿Falso o verdadero ?: Los renglones 1, 2, 3 de A son linealmente independientes. 

d) ¿Cuál es una base para el espacio columna de A? 

e) ¿Cuál es la dimensión del espacio nulo izquierdo de A? 

f) ¿Cuál es la solución general de Ax = 0? 


Capítulo 



Ortogonalidad 


3.1 VECTORES Y SUBESPACIOS ORTOGONALES 

Una base es un conjunto de vectores independientes que genera un espacio. Geométrica¬ 
mente, es un conjunto de ejes coordenados. Un espacio vectorial se define sin estos ejes, 
aunque cada vez que pienso en el plano x-y, en el espacio tridimensional o en R", ahí es¬ 
tán los ejes. ¡Suelen ser perpendiculares! Los ejes coordenados producto de la imaginación 
prácticamente siempre son ortogonales. Al elegir una base, se tiende a elegir una ortogo¬ 
nal. 

Uno de los fundamentos del álgebra lineal es el concepto de base ortogonal. Se re¬ 
quiere una base para convertir construcciones geométricas en cálculos algebraicos, y se 
necesita una base ortogonal para que estos cálculos sean sencillos. Especialización más 
detallada hace casi óptima la base: los vectores deben tener longitud 1. Para una base or- 
tonormal (vectores unitarios ortogonales) se encuentra que 

1. la longitud ||x|| de un vector; 

2. la prueba x T y = 0 para vectores perpendiculares; y 

3. cómo crear vectores perpendiculares a partir de vectores linealmente independientes. 

Más que justamente vectores, los subespacios también pueden ser perpendiculares. Se 
descubrirá, de manera tan hermosa y simple que será una delicia ver, que los subespacios 
fundamentales se encuentran a ángulos rectos. Estos cuatro subespacios fundamentales 
son perpendiculares por pares, dos en R m y dos en R". Esto completará el teorema funda¬ 
mental del álgebra lineal. 

El primer paso es encontrar la longitud de un vector , que se denota por ||x||, y en 
dos dimensiones proviene de la hipotenusa de un triángulo rectángulo (véase la figura 
3.1a). El cuadrado de la longitud fue proporcionado hace mucho tiempo por Pitágoras: 
||x|| 2 =x? +xf. 


(0,0, 3) í 


( 0 , 2)1 J ( 1 , 2 ) ,, , |2 


x\\ 2 = x\ 4- x\ + x\ 


- 7 2 5 = i 2 + 2 2 ; y .; 

/ 14 = l 2 H- 2 2 + 3 2 ' / ' ; 

(1, 0, O f - : *“(1,2,0) tiene longitud v/5 

a) b ) 

Figura 3.1 Longitud de los vectores (x 1; x 2 ) y (x t , x 2 , x 3 ). 


¿(1,2,3) tiene longitud s/\A 
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En el espacio tridimensional, x — (x l , x 2 , x 3 ) es la diagonal de una caja (véase la figu¬ 
ra 3.1 b). Su longitud proviene de dos aplicaciones de la fórmula de Pitágoras. El caso bi- 
dimensional se ocupa de (x l , x 2 , 0) = (1, 2, 0) a través de una base. Esto forma un ángulo 
recto con el lado vertical (0, 0, x 3 ) = (0, 0, 3). La hipotenusa del triángulo en negritas (nue¬ 
vamente Pitágoras) es la longitud |¡xl| que se busca: 

Longitud en 3 dimensiones ||x|| 2 = l 2 + 2 2 + 3 2 y ||x|| = \Jx\ + xf + xf. 

La extensión ax = (x¡, ..., x„) en n dimensiones es inmediata. Por el teorema de Pi¬ 
tágoras multiplicado por n - 1 veces, la longitud de ||x)| en R" es la raíz cuadrada positi¬ 
va de x T x: 


Longitud al cuadrado 


■2 + ' " +X 2 = X T X. 

- \ - 


La suma de cuadrados corresponde a x T x, y la longitud de x = (1, 2, —3) es -/Í4: 


x T x = [l 2 -3] 2 = l 2 +2 2 +(-3) 2 = 14. 

-3 


Vectores ortogonales 

¿Cómo decidir si dos vectores x y y son perpendiculares? ¿Cuál es la prueba de ortogona¬ 
lidad en la figura 3.2? En el plano generado porx y y, estos vectores son ortogonales en el 
supuesto de que formen un triángulo rectángulo. Volvamos a a 2 + b 2 = c 2 : 

Lados de un triángulo rectángulo ||x|| 2 + ||y|| 2 = [|x — y[[ 2 . (2) 

Al aplicar la fórmula de la longitud (1), esta prueba de ortogonalidad en R" se vuelve 

(*? + ••• +*„) + (y? + • * • +y 2 ) = (*i - yi) 2 + • • • +(x„ - y n ) 2 . 

El miembro derecho contiene un término -2x¡y¡ extra de cada (x¡ - y¡) 2 : 

miembro derecho = (x? + • • • + x 2 ) - 2{x x y x + • • • + x„y„) + (yf + • • • + y 2 ). 

Se tiene un triángulo rectángulo cuando la suma de los términos del producto cruz x¡y¡ es 
cero: 

Vectores ortogonales x T y = x¿y t + • • • + x„y n = 0. (3) 

Esta sumatoria es x T y = X x¡ y¡ = y r x, el vector renglón x T multiplicado por el vector co¬ 
lumna y: 


Producto interno x T y = [x x 



= x x y x + ■ ■ ■ + x n y n . 


(4) 
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Figura 3.2 Triángulo rectángulo con 5 + 20 = 25. Ángulo con línea punteada 100°, án¬ 
gulo con línea discontinua 30°. 

Algunas veces este número se denomina producto escalar o producto punto, y se denota por 
(x, y) o x • y. Aquí se usará el nombre de producto interno y se preservará la notación x T y. 

3A El producto intemo x T y es cero si y sólo si x y y son Vectores ortogonales. Si 
x T y > 0, su ángulo es menor que 90°. Si x r y < 0, su ángulo es mayor «fue 90°. 

La longitud al cuadrado es el producto interno de x consigo mismo: x T x = x 2 + • • • + 
x 2 = |¡x|| 2 . El único vector con longitud cero —el único vector que es ortogonal a sí 
mismo— es el vector cero. Este vector x = 0 es ortogonal a cada vector en R". 

Ejemplo 1 (2, 2, —1) es ortogonal a (— 1, 2, 2). La longitud de cada uno es ^/4 + 4 + 1 = 3. 

Hecho útil : Si los vectores diferentes de cero v x ,... ,v k son mutuamente ortogonales 
(cada vector es perpendicular a los demás), entonces estos vectores son linealmente in¬ 
dependientes. 

Demostración Suponga que cqiq + ■ • • + c k v k = 0. Para demostrar que Ci debe ser cero, 
se toma el producto interno de ambos miembros con tq. Debido a la ortogonalidad de las 
us, se queda con un solo término: 

^(Ath + ■ • • +c k v k ) = civjvi = 0. (5) 

Los vectores son diferentes de cero, de modo que ujui 0 y en consecuencia c x = 0. 
Lo mismo se cumple para cada c¡. La única combinación de las us que produce 0 tiene a 
todas las c¡ — 0: \independencia\ ■ 

Los vectores coordenados e x ,, e n en R” son los vectores ortogonales más impor¬ 
tantes. Éstos son las columnas de la matriz identidad. Constituyen la base más sencilla de 
R", y son vectores unitarios: la longitud de cada uno es ||e,|| = 1. Apuntan a lo largo de los 
ejes de coordenadas. Si estos vectores se rotan, el resultado es una nueva base ortonor- 
mal: un nuevo sistema de vectores unitarios mutuamente ortogonales. En M 2 se tiene eos 2 
9 + sen 2 0=1: 

Vectores ortonormales en R 2 v , = (eos 9, sen 0) y v 2 = (—sen 0, eos 0). 

Subespacios ortogonales 

A continuación se abordará la ortogonalidad de dos subespacios. Cada vector en un subes¬ 
pacio debe ser ortogonal a cada vector en el otro subespacio. Los subespacios de R 3 pue¬ 
den tener dimensión 0, 1, 2, o 3. Estos subespacios están representados por rectas o planos 
que pasan por el origen, y en casos extremos, sólo por el origen o todo el espacio. El 
subespacío {0} es ortogonal a todos los subespacios. Una recta puede ser ortogonal a otra 
recta, o puede ser ortogonal a un plano, pero un plano no puede ser ortogonal a un plano. 
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Debo admitir que el muro frontal y el muro lateral de una habitación se ven como pla¬ 
nos perpendiculares en R 3 . Pero según nuestra definición, ¡no es así! Hay rectas ti y tu en 
los muros frontal y lateral que no se encuentran a ángulos rectos. La recta que corre a lo 
largo de la arista pertenece a ambos muros, y ciertamente no es ortogonal a sí misma. 

3B Dos subespacios V y W del mismo espacio R" son ortogonales si cada vector 
v en V es ortogonal a cada vector w en W: v T w = 0 para toda ti y tu. 

Ejemplo 2 Suponga que V es el plano generado por v l = (1, 0, 0, 0) y v 2 — (1, 1, 0, 0). Si W es el 
plano generado por tu = (0, 0, 4, 5), entonces w es ortogonal a ambos vectores us. La rec¬ 
ta W es ortogonal a todo el plano V. 

En este caso, con subespacios de dimensiones 2 y 1 en R 4 , hay espacio para un tercer 
subespacio. La recta L que pasa por z = (0, 0, 5, -4) es perpendicular a V y W. Así, la su¬ 
ma de las dimensiones es 2 -I- 1 + 1 = 4. ¿Qué espacio es perpendicular a los tres, V, W, 

y l? 


Los importantes subespacios ortogonales no se presentan accidentalmente, y se pre¬ 
sentan por pares. De hecho, los subespacios ortogonales son inevitables: ¡ Son los espacios 
fundamentalesl El primer par lo constituyen el espacio nulo y el espacio renglón. Estos 
son subespacios de R": los renglones tienen n componentes, como el vector x en Ax = 0. 
Es necesario demostrar, usando Ax = 0, que los renglones de A son ortogonales al vector 
x en el espacio nulo. 


3C Teorema fundamental de ©r 


i El espacio renglón es ortogon; 


pació nulo (en R n ). El espacio columna es ortogonal al espacio nulo izquierdo (e: 



Primera demostración Suponga que x es un vector en el espacio nulo. Entonces Ax = 0, y 
este sistema de m ecuaciones puede escribirse como renglones de A que multiplican a x: 


Todo renglón es 
ortogonal a x 

Ax = 

■ • • renglón 1 
• • • renglón 2 


V 

x-i 

__ 

o o' 



■ • ■ renglón m • • • 


X„ 


A 


La cuestión importante ya está presente en la primera ecuación: el renglón 1 es orto¬ 
gonal a x. Su producto interno es cero: esa es la ecuación 1. Todo miembro derecho es ce¬ 
ro, de modo que x es ortogonal a todo renglón. En consecuencia, x es ortogonal a toda 
combinación de los renglones. Cada x en el espacio nulo es ortogonal a cada vector en el 
espacio renglón, de modo que N(A) ± C(A T ). 

El otro par de subespacios ortogonales proviene de A r y = 0, o y T A = 0: 


y T A 


Di 


c 

o 

1 

u 

m 

n 


c 

o 

1 

u 

m 

n 


0], 


(7) 


El vector y es ortogonal a cada columna. La ecuación así lo indica, a partir de los ceros en 
el miembro derecho. En consecuencia, y es ortogonal a toda combinación de las columnas. 



) 

! 
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Es ortogonal al espacio columna, y se trata de un vector típico en el espacio nulo izquier¬ 
do: N(A r ) A. C(A) . Esto es lo mismo que la primera mitad del teorema, con A sustitui¬ 
da por A t . ■ 

Segunda demostración El contraste con esta “demostración libre de coordenadas” debe ser 
de utilidad para el lector. Constituye un método de razonamiento más “abstracto”. Me gus¬ 
taría saber cuál de las dos demostraciones es más clara y mejor comprendida. 

Si x está en el espacio nulo, entonces Ax = 0. Si i) está en el espacio renglón, es una 
combinación de los renglones: v — A T z para algún vector z. Así, en una línea: 

Espacio nulo _L Espacio renglón V T X = ( A T zfx = z T Ax = z T 0 = 0. (8) 


3.1 Vectores y subespaciO||>ítGgons|es 


Ejemplo 3 


Suponga que el rango de A es 1, de modo que su espacio columna y su espacio renglón son 
rectas: 


Matriz de rango 1 



3' 

6 

9 


Los renglones son múltiplos de (1, 3). El espacio nulo contiene ax = (—3, 1), que es orto¬ 
gonal a todos los renglones. El espacio nulo y el espacio renglón son rectas perpendicula¬ 
res en R 2 : 


[1 



y 


[2 6 ] 


= 0 y 





= 0 . 


En contraste, los otros dos subespacios están en R 3 . El espacio columna es la recta que pa¬ 
sa por (1,2, 3). El espacio nulo izquierdo debe ser el plano y y + 2y 2 + 3y 3 = 0. Esta ecua¬ 
ción es exactamente el contenido de y r A = 0. 


Los dos primeros subespacios (las dos rectas) tienen dimensiones 1 + 1 = 2 en el es¬ 
pacio R 2 . El segundo par (recta y plano) tienen dimensiones 1 + 2 = 3 en el espacio R 3 . 
En general, el espacio renglón y el espacio nulo tienen dimensiones cuya suma es r + (n- 
r) = n. La suma de las dimensiones del otro par es igual a r + (m - r) = m. Está ocurrien¬ 
do algo más que la ortogonalidad, por lo que pido paciencia al lector para abordar otra cues¬ 
tión adicional: las dimensiones. 

Con toda certeza es verdad que el espacio nulo es perpendicular al espacio renglón, 
aunque ésta no es toda la verdad. N(A) contiene a todo vector ortogonal al espacio ren¬ 
glón. El espacio nulo fue formado a partir de todas las soluciones de Ax = 0. 

DEFINICION Dado un subespacio V de R", el espacio de todos los vectores ortogonales 
a V se denomina complemento ortogonal: de V. Se denota por V x = “V perp.” 


Con esta terminología, el espacio nulo es el complemento ortogonal del espacio ren¬ 
glón: N(A) — (C(A t )) j -. Al mismo tiempo, el espacio renglón contiene a todos los vec¬ 
tores que son ortogonales al espacio nulo. Un vector z no puede ser ortogonal al espacio 
nulo sino fuera del espacio renglón. Al agregar z como un renglón extra de A se agranda el 
espacio renglón, aunque se sabe que hay una fórmula fija r + (n - r) = n: 

Fórmula de la dimensión dim(espacio renglón) + dim(espacio nulo) = número de 
columnas. 


Todo vector ortogonal al espacio nulo está en el espacio renglón: C(A T ) = (N(A)) X . 
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El mismo razonamiento apEcado a A T produce el resultado dual: El espacio nulo iz¬ 
quierdo N{A t ) y el espacio columna C(A) son complementos ortogonales. La suma de sus 
dimensiones es igual a (m - r) + r = m. Esto completa la segunda mitad del teorema fun¬ 
damental del álgebra lineal. La primera mitad proporcionó las dimensiones de los cuatro 
subespacios, incluyendo el hecho de que rango renglón = rango columna. Ahora se sabe 
que estos subespacios son perpendiculares. Más que eso, los subespacios son complemen¬ 
tos ortogonales. 

3D Teorema fundamental del álgebra lineal, parte II \ 

:: El espacio nulo es el complemento ortogonal del espacio renglón en R”. {8 

El espacio nulo izquierdo es el complemento ortogonal del espacio columna en R m . JV 

Para repetir, el espacio renglón contiene todo lo que es ortogonal al espacio nulo. El espa¬ 
cio columna contiene todo lo que es ortogonal al espacio nulo izquierdo. Esta es sólo una 
oración, escondida a medio libro, pero ¡ decide cuáles ecuaciones pueden resolverse\ Si se 
mira directamente, Ax = b requiere que b esté en el espacio columna. Si se mira indirecta¬ 
mente, Ax — b requiere que b sea perpendicular al espacio nulo izquierdo. 

3E Ax = b es resoluble si y sólo si y T b — 0 siempre que y r A — 0. 

El método directo fue “b debe ser una combinación de las columnas”. El método indirecto 
es “b debe ser ortogonal a cada vector ortogonal a las columnas”. Esto no se ve como una 
mejoría (para plantearlo en términos suaves). Pero si sólo uno o dos vectores son ortogona¬ 
les a las columnas, resulta mucho más fácil comprobar estas una o dos condiciones y T b = 
0. Un buen ejemplo es la ley del voltaje de Kirchhoff en la sección 2.5. Verificar cero alre¬ 
dedor de los circuitos es mucho más fácil que reconocer combinaciones de las columnas. 

Cuando la suma de los miembros izquierdos de Ax =b es cero, entonces los miem¬ 
bros derechos también tienen que cumplir lo siguiente: 

X\ — x 2 — b\ 1—10 

X 2 xj — b 2 es resoluble si y sólo si b\ + b 2 + b 2 = 0. Aquí A = 0 1 — 1 . 

x-¡ — Xi = ¿>3 —10 1 

Esta prueba b l + b 2 + b 3 = 0 hace que b sea ortogonal a y = (1, 1, l)enel espacio nulo 
izquierdo. Por el teorema fundamental, \b es una combinación de las columnas! 

La matriz y los subespacios 

Se recalca que V y W pueden ser ortogonales sin ser complementos. Sus dimensiones tam¬ 
bién pueden ser pequeñas. La recta V generada por (0, 1, 0) es ortogonal a la recta W ge¬ 
nerada por (0, 0, 1), pero V no es W x . El complemento ortogonal de W es un plano 
bidimensional, y la recta es sólo parte de W x . Cuando las dimensiones están correctas, los 
subespacios ortogonales son necesariamente complementos ortogonales. 

Si W = V- 1 -, entonces V = W x y dim V + dim W — n. 

En otras palabras, V xx = V. Las dimensiones de V y W están correctas, y todo el espacio 
R" se ha descompuesto en dos partes perpendiculares (véase la figura 3.3). 
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Al separar R" en dos partes ortogonales, cada vector se separa en x = v + w. El vec¬ 
tor v es la proyección sobre el subespacio V. La componente ortogonal w es la proyección 
de x sobre W. En la siguiente sección se muestra cómo encontrar estas proyecciones de x. 
Éstas conducen a lo que quizá es la figura más importante del libro (véase la figura 3.4). 

En la figura 3.4 se resume el teorema fundamental del álgebra lineal. Ilustra el verda¬ 
dero efecto de una matriz: lo que ocurre al interior de la multipEcación Ax. El espacio nu¬ 
lo es llevado al vector cero. Todo Ax está en el espacio columna. Nada se manda al espacio 
nulo izquierdo. La verdadera acción es entre el espacio renglón y el espacio columna, y el 
lector verá esto al anaEzar un vector típico x. Éste contiene una “ componente del espacio 
renglón” y una “componente del espacio nulo”, con x = x r + x n . Cuando esto se multipü- 
ca por A, se trata de Ax = Ajc r + Ax„: 


La componente del espacio nulo se va en cero: Ax n = 0. 

La componente del espacio renglón se va al espacio columna: Ax r = Ax. 

Por supuesto, todo va al espacio columna: la matriz no puede hacer otra cosa. He intenta¬ 
do hacer los espacios renglón y columna del mismo tamaño, con dimensión igual r. 


3F Del .espacio renglón al espacio columna, A en realidad es invernóle. Cada vector 
b en el espacio columna proviene exactamente de un vector x r en el espacio renglón. 
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Demostración Todo b en el espacio columna es una combinación Ax de las columnas. De 
hecho, b es Ax n con x r en el espacio renglón, ya que la componente del espacio nulo da 
Ax n = 0. Si otro vector x' r en el espacio renglón proporciona Ax' r = b , entonces A{x r — 
x’ r ) — b — b = 0. Esto coloca a x r — x’ r en el espacio nulo y en el espacio renglón, lo cual 
lo hace ortogonal a sí mismo. En consecuencia, es cero, y x r — x'. Exactamente un vector 
en el espacio renglón es llevado a b. g 

Toda matriz transforma su espacio renglón sobre su espacio columna. 


Sobre estos espacios r-dimensionales, A es invertible. Sobre su espacio nulo, A es cero. 
Cuando A es diagonal, se observa que la submatriz invertible preserva los r no ceros. 

A T va en dirección opuesta, de R m a R" y de C(A) de vuelta a C(A T ). Por supuesto, ¡la 
traspuesta no es la inversa! A T mueve correctamente los espacios, pero no los vectores in¬ 
dividuales. Este honor corresponde a A -1 en caso de existir, y sólo existe si r = m — n. No 
puede pedirse que A -1 regrese todo un espacio nulo a partir del vector cero. 

Cuando A'" 1 no existe, el mejor sustituto es la seudoinversa A + . Esta matriz invierte A 
donde es posible hacerlo: A + Ax = x para x en el espacio renglón. Sobre el espacio nulo iz¬ 
quierdo, nada puede hacerse: A + y = 0. Así, A 4 invierte A cuando ésta es invertibíe, y tiene 
el mismo rango r. Una fórmula para A + depende de la descomposición del valor singular, 
tema para el cual antes se requiere saber algo sobre valores característicos (o singulares). 


Conjunto de problemas 3.1 

1. Encuentre las longitudes y el producto interno de x = (1, 4, 0, 2) y y = (2, —2, 1, 3). 

2. Proporcione un ejemplo en R 2 de vectores linealmente independientes que no sean or¬ 
togonales. También, proporcione un ejemplo de vectores ortogonales que no sean in¬ 
dependientes. 

3. Dos rectas en el plano son perpendiculares cuando el producto de sus pendientes es 
—1. Aplique este hecho a los vectores x = (x l , xf) y y — (y x , y 2 ), cuyas pendientes son 
x 2 Ai y y 2 />i» para deducir nuevamente la condición de ortogonalidad x r y = 0 . 

4. Cómo puede saberse si el i-é simo renglón de una matriz in vertible B es ortogonal a la 
j-ésima columna de B~ l , si i ¥* p. 

5. De los siguientes vectores, v v v 2 , v 3 , v 4 ¿qué pares son ortogonales? 



1' 


'4 


f 


T 


2 


0 


-1 


1 

V¡ = 

-2 

, V2 — 

4 

, r 3 = 

-1 

. r 4 = 

1 


1 


0 


-I 


1 


6. Encuentre todos los vectores en R 3 que son ortogonales a (1, 1, 1) y (1, —1,0). Escri¬ 
ba una base ortonormal a partir de estos vectores (vectores unitarios mutuamente or¬ 
togonales). 

7. Encuentre un vector x ortogonal al espacio renglón de A, un vector y ortogonal al es¬ 
pacio columna, y un vector z ortogonal al espacio nulo: 


1 2 

2 4 

3 6 


1 

3 

4 




; 
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8. Si Y y W son subespacios ortogonales, demuestre que el único vector que tienen en 
común es el vector cero: VnW = {0}. 

9. Encuentre el complemento ortogonal del plano generado por los vectores (1, 1, 2) y 
(1,2, 3), considerando que son los renglones de A y resolviendo Ax = 0. Recuerde que 
el complemento es toda una recta. 

10. Escriba una ecuación homogénea en tres incógnitas cuyas soluciones sean la combi¬ 
nación lineal de los vectores (1, 1, 2) y (1, 2, 3). Ésta es el inverso del ejercicio pre¬ 
vio, aunque en realidad ambos problemas son el mismo. 

11. A menudo, el teorema fundamental se plantea en forma de la alternativa de Fredholrrv. 
Para Ay b cualesquiera, uno y sólo uno de los siguientes sistemas tiene una solución: 

i) Ax = b. 

ii) A T y = 0, y T b ± 0. 

Ya sea que b esté en el espacio columna C(A) o que en N(A T ) exista una y tal que 
y r b A 0. Demuestre que esto es contradictorio, ya que ambos i) y ii) tienen soluciones. 

12. Encuentre una base para el complemento ortogonal del espacio renglón de A: 


Separe x = (3, 3, 3) en una componente del espacio renglón x r y una componente del 
espacio nulo x„. 

13. Ilustre la acción de A r mediante una figura que corresponda a la figura 3.4, mandan¬ 
do C(A) de vuelta al espacio renglón y el espacio nulo izquierdo a cero. 

14. Demuestre quex — y es ortogonal a x -I- y si y sólo si ||x¡| = ||y||. 

15. Encuentre una matriz cuyo espacio renglón contenga a (1, 2, 1) y cuyo espacio nulo a 
(1, —2, 1), o demuestre que no puede existir una matriz así. 

16. Encuentre todos los vectores que son perpendiculares a (1, 4, 4, 1) y (2, 9, 8, 2). 

17. Si V es el complemento ortogonal de W en R", ¿existe una matriz con espacio ren¬ 
glón V y espacio nulo W? Empiece con una base de V, y obtenga tal matriz. 

18. Si S = {0} es el subespacio de R 4 que sólo contiene al vector cero, ¿cuál es S x ? Si S 
es generado por (0, 0, 0, 1), ¿cuál es S x ? ¿Cuál es (S 2- ) 2- ? 

19. ¿Por qué son falsas las siguientes afirmaciones! 

a) Si V es ortogonal a W, entonces V 2 - es ortogonal a W x . 

b) V es ortogonal aWyW ortogonal a Z hace que V sea ortogonal a Z. 

20. Sea S un subespacio de R n . Explique el significado de (S x ) x = S, y por qué es ver¬ 
dadera. 

21. Sea P el plano en R 2 con ecuación x + 2y - z = 0. Encuentre un vector perpendicu¬ 
lar a P. ¿Qué matriz tiene al plano P como espacio nulo y qué matriz tiene a P como 
su espacio renglón? 

22. Sea S el plano de R 4 que contiene a todos los vectores con + x z + x 3 + x 4 — 0. En¬ 
cuentre una base para el espacio S x que contenga a todos los vectores ortogonales a S. 
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23. Construya una matriz no simétrica de 2 por 2 con rango 1. Copie la ñgura 3.4 y escri¬ 
ba un vector en cada subespacio. ¿Qué vectores son ortogonales? 

24. Vuelva a dibujar la figura 3.4 para una matriz de 3 por 2 con rango r — 2. ¿Cuál subes¬ 

pacio es Z (sólo el vector cero)? La parte del espacio nulo de cualquier vector x en R 2 
es x n = _. 

25. Construya una matriz con la propiedad requerida o escriba una razón que explique por 
qué es imposible hacerlo. 

r n r 2 ] rr 

a) El espacio columna contiene a 2 y -3 , el espacio columna contiene a i . 


a) El espacio columna contiene a 2 y -3 I el espacio columna contiene a 


i 2 i 

b) El espacio renglón contiene a 2 y -3 , el espacio nulo contiene a i . 

■n f i j fo' 

c) a x = i tiene una solución y A T o = o . 

ij [oj Lo. 

d) Cada renglón es ortogonal a cada columna (A no es la matriz cero). 

e) La suma de las columnas es una columna de Os y la suma de los renglones es un 
renglón de Is. 

26. Si AB = 0, entonces las columnas de B están en las (los)_de A. Los renglones de 

A están en las (los)_de B. ¿Por qué A y B no pueden ser matrices de 3 por 3 con 

rango 2? 

27. a) Si Ax = b tiene una solución y A T y = 0, entonces y es perpendicular a_. 

b) Si A T y = c tiene una solución y Ax = 0, entonces x es perpendicular a_. 

28. El siguiente es un sistema de ecuaciones Ax — b sin solución: 

x + 2y + 2z = 5 
2x + 2y + 3z = 5 
3x + 4y + 5z = 9. 

Encuentre números y { , y 2 y y 3 que multipliquen las ecuaciones de modo que sumen 
0=1. ¿Encontró un vector y, en cuál subespacio? El producto interno y r b es 1. 

29. En la figura 3.4, ¿cómo se sabe que Ax r es igual a Ax? ¿Cómo se sabe que este vector 

está en el espacio columna? Si A = ^} } j y x = [¿ j , ¿cuál es x r ? 

30. Si Ax está en el espacio nulo de A T , entonces Ax = 0. Razón: Ax también está en el ____ 

de A y los espacios son_. Conclusión: A r A tiene el mismo espacio nulo que A. 

31. Suponga que A es una matriz simétrica (A T = A). 

a) ¿Por qué su espacio columna es perpendicular a su espacio nulo? 

b) Si Ax = 0 y Az — 5z, ¿cuáles subespacios contienen a los “vectores característicos” 
x y z? Las matrices simétricas tienen vectores característicos perpendiculares 
(consulte la sección 5.5). 

32. (Recomendado) Dibuje la figura 3.4 con la finalidad de mostrar cada subespacio para 

, _ fl 2] _ _ fl 0' 

A |3 6 J y B [3 0. ’ 

33. Encuentre las piezas x r y x„, y trace idóneamente la figura 3.4, si 

_1 _1 1 f2l 

A=0 0 y x = 

0 0 i- u J 
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Los problemas 34 a 44 son sobre subespacios ortogonales. 

34. Escriba bases de los espacios ortogonales V y W en las columnas de las matrices V y 
W. ¿Por qué V T W = matriz cero ? Esto corresponde a v r w — 0 para vectores. 

35. El piso y la pared no son subespacios ortogonales porque comparten un vector dife¬ 
rente de cero (a lo largo de la recta en que se unen). ¡Dos planos en R 3 no pueden ser 
ortogonales! Encuentre un vector en ambos espacios columna C(A) y C(B): 


'1 

2 

'5 

4l 

1 

3 y 

B — 6 

3 . 

1 

2 

5 

lj 


Este es un vector Ax y también Bx ■ Piense en la matriz [A 13] de 3 por 4. 

36. Extienda el problema 35 a un subespacio p-dimensional V y un subespacio ¿/-dimen¬ 
sional W de R”. ¿Qué desigualdad sobre p + q garantiza que V se corta con W en un 
vector diferente de cero? Estos subespacios no pueden ser ortogonales. 

37. Demuestre que cada y en 1V(A T ) es perpendicular a cada Ax en el espacio columna, 
usando la abreviatura para matrices de la ecuación (8). Empiece con A r y = 0. 

38. ¿Si S es el subespacio de R 3 que sólo contiene al vector cero, ¿cuál es S 3 ? Si S es ge¬ 
nerado por (1, 1, 1), ¿cuál es S 3 ? Si S es generado por (2, 0, 0) y (0, 0, 3), ¿cuál es S 3 ? 

39. Suponga que S sólo contiene a (1, 5, 1) y a (2, 2, 2) (no es un subespacio). Entonces 

S x es el espacio nulo de la matriz A =_. S 3 - es un subespacio aun cuando S no lo 

sea. 

40. Suponga que L es un subespacio unidimensional (una recta) en R 3 . Su complemento 

ortogonal L 3 - es el (la)_perpendicular a L. Luego, (L 3 ) 3 es un (una)_per¬ 
pendicular aL 3 . De hecho, (L 3 ) 3 es lo mismo que_. 

41. Suponga que V es todo el espacio R 4 . Entonces V 3 sólo contiene al vector_. Así, 

(V 3- ) 3- es_. De modo que (V 3 -) 3 - es lo mismo que_. 

42. Suponga que S es generado por los vectores (1, 2, 2, 3) y (1, 3, 3, 2). Encuentre dos 
vectores que generen a S 3 . Esto es lo mismo que resolver Ax = 0 ¿para cuál A? 

43. Si P es el plano de los vectores en R 4 que satisfacen x t + x 2 + x 3 + x 4 = 0, escriba 
una base de P 3 . Escriba una matriz cuyo espacio nulo sea P. 

44. Si un subespacio S está contenido en un subespacio V, demuestre que S 3 contiene a V 3 . 

Los problemas 45 a 50 son sobre columnas y renglones perpendiculares. 

45. Suponga que una matriz de n por n es invertible: AA~‘ = I. Entonces, la primera co¬ 
lumna de,A -1 es ortogonal al espacio generado por ¿cuáles renglones de A? 

46. Encuentre A T A si las columnas de A son vectores unitarios, todos mutuamente perpen¬ 
diculares. 

47. Construya una matriz A de 3 por 3 sin elementos cero cuyas columnas sean mutua¬ 
mente perpendiculares. Calcule A T A. ¿Por qué es una matriz diagonal? 

48. Las rectas 3x + y = b x y 6x + 2y = b 2 son__. Son la misma recta si_.. En ese 

caso, (b x , b 2 ) es perpendicular al vector __. El espacio nulo de la matriz es la recta 

3 x + y — _. Un vector particular en ese espacio nulo es_. 
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49. ¿Por qué es falsa cada una de las siguientes afirmaciones? 

a) (1, 1, 1) es perpendicular a (1, 1, —2), de modo que los planos x + y+ r = Oy 
x + y — 2z = 0 son subespacios ortogonales. 

b ) El subespacio generado por (1, 1, 0, 0, 0) y (0, 0, 0, 1, 1) es el complemento orto¬ 
gonal del subespacio generado por (1, — 1, 0, 0, 0) y (2, —2, 3, 4, —4). 

c) Dos subespacios que sólo se cortan en cero son ortogonales. 

50. Encuentre una matriz con v = (1, 2, 3) en el espacio renglón y en el espacio colum¬ 
na. Encuentre otra matriz con v en el espacio nulo y en el espacio columna. ¿En cuá¬ 
les pares de subespacios puede no estar u? 

51. Suponga que A es de 3 por 4, que B es de 4 por 5, y que AB = 0. Demuestre que ran- 
go(A) + rango(¿?) < 4. 

52. El comando N = null(A) produce una base del espacio nulo de A. Así, el comando 

B = null(A/') produce una base para el_de A. 

3.2 COSENOS Y PROYECCIONES SOBRE RECTAS 

Los vectores con x T y = 0 son ortogonales. Ahora se quiere permitir productos intemos dis¬ 
tintos de cero , y ángulos que no sean rectos. Se desea relacionar los productos internos con 
los ángulos, y también con las traspuestas. En el capítulo 1 la traspuesta se construyó dán¬ 
dole la vuelta a una matriz como si fuese algún tipo de panqué. Es necesario mejorar lo an¬ 
terior. 

Algo es inevitable: el caso ortogonal es el más importante. Suponga que se desea en¬ 
contrar la distancia de un punto b a la recta en dirección del vector a. En esa recta se bus¬ 
ca el punto p más próximo a b. La clave está en la geometría: la recta que une b con p (la 
recta discontinua en la figura 3.5) es perpendicular a a. Este hecho permite encontrar 
la proyección p. Aun cuando a y b no sean ortogonales, el problema de la distancia auto¬ 
máticamente supone ortogonalidad. 



Figura 3.5 La proyección p es el punto (sobre la recta que pasa por a) más próximo a b. 

La situación es la misma que cuando se tiene un plano (o con cualquier subespacio S) 
en vez de una recta. De nuevo, el problema es encontrar el punto p en ese subespacio que 
sea el más próximo a b. Este punto p es la proyección de b sobre el subespacio. Una rec¬ 
ta peipendicular de b a S corta al subespacio en p. Geométricamente, así se obtiene la dis¬ 
tancia entre puntos b y subespacios S. Sin embargo, hay dos preguntas que es necesario 
plantear: 
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1. Esta proyección, ¿realmente se presenta en aplicaciones prácticas? 

2. Si se tiene una base del subespacio S, ¿hay una fórmula para la proyección p7 

Ciertamente, las respuestas son sí. Este es exactamente el problema de la solución por 
mínimos cuadrados de un sistema sobredeterminado. El vector b representa los datos pro¬ 
venientes de experimentos o cuestionarios, y contiene demasiados errores para ser encon¬ 
trado en el subespacio S. Cuando se intenta escribir b como una combinación de los 
vectores de la base de S, no es posible hacerlo, ya que las ecuaciones son inconsistentes, y 
Ax — b no tiene solución. 

El método de mínimos cuadrados selecciona a p como la mejor opción para sustituir 
a b. No puede haber duda sobre la importancia de esta aplicación. En economía y estadís¬ 
tica, los mínimos cuadrados introducen el análisis de regresión. En geodesia, el departa¬ 
mento de agrimensura de Estados Unidos abordó 2.5 millones de ecuaciones en 400 000 
incógnitas. 

Una fórmula para p es fácil cuando el subespacio es una recta. Entonces b se proyec¬ 
tará sobre a de varias formas, y la proyección p se relacionará con varios productos inter¬ 
nos y ángulos. La proyección sobre un subespacio de dimensión mayor es por mucho el 
caso más importante; corresponde a un problema de mínimos cuadrados con varios pará¬ 
metros, y se resolverá en la sección 3.3. Las fórmulas son incluso más sencillas cuando se 
produce una base ortogonal de S. 


Productos internos y cosenos 

A continuación se abordará el análisis de los productos internos y los ángulos. Pronto se 
verá que no es el ángulo, sino el coseno del ángulo, el que está relacionado directamente 
con los productos internos. Se acude a la trigonometría en el caso bidimensional para en¬ 
contrar la relación. Suponga que los vectores ay b forman ángulos a y ¡3 con el eje x (véa¬ 
se la figura 3.6). 



Figura 3.6 Coseno del ángulo 8 — ¡3 -a usando productos internos. 

La longitud ||a|| es la hipotenusa del triángulo OaQ. Así, el seno y el coseno de a son 

a 2 ai 

sen a = -, eos a = -—-. 

lia II Hall 

Para el ángulo /3, el seno es b 2 /\\b |j, y el coseno es ¿> 1 /||¿>jj. El coseno de 9 - - a provie¬ 

ne de una identidad inolvidable: 


eos 9 = eos p eos a + sen $ sen a = 


a\b\ + a 2 b 2 

Hall m ' 


Fórmula del coseno 


( 1 ) 
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El numerador en esta fórmula es exactamente el producto interno de a y b. Esto es propor¬ 
cional a la relación entre a r b y eos 9: 

36 El coseno del ángulo entre dos vectores, a y b cualesquiera diferentes de cero es 

a r b 

Coseno de# eos9 — -. . (2) 

INI 11*11 

Esta fórmula es dimensionalmente conecta: si se duplica la longitud de b, entonces tanto 
el numerador como el denominador se duplican, y el coseno permanece sin cambio. Al in¬ 
vertir el signo de b, por otra parte, se invierte el signo de eos 6 y el ángulo cambia por 180°. 

Hay otra ley de trigonometría que conduce directamente al mismo resultado. No es tan 
inolvidable como la fórmula de la ecuación (1), aunque relaciona las longitudes de los la¬ 
dos de cualquier triángulo: 

Ley de los cosenos || b - af = ||¿>|| 2 + ¡|a¡| 2 - 2||¿|| ¡|a|| cosí?. (3) 

Cuando 6 es un ángulo recto, se acude al teorema de Pitágoras: II* — all 2 = li*ll 2 + ||a|| 2 . 
Para cualquier ángulo 9, la expresión jj b — a\\ 2 es (b — a) T (b - a), y la ecuación (3) se con¬ 
vierte en 

b T b — 2a r b + a 1 a = b T b + a 1 a — 2\\b\\ ¡|u|| eos 9. 

Al cancelar b T b y a T a en ambos miembros de esta ecuación, se reconoce la fórmula (2) pa¬ 
ra el coseno: a T b = ||a|| ||2>|| eos 9- De hecho, esto demuestra la fórmula del coseno en n 
dimensiones, ya que sólo es necesario preocuparse sobre el triángulo plano Oab. 


Proyección sobre una recta 


Ahora se desea encontrar el punto proyección p. Este punto debe ser algún múltiplo 
p — xa del vector dado a: cada punto sobre la recta es un múltiplo de a. El problema es 
calcular el coeficiente x . Todo lo que se requiere es el hecho geométrico de que la recta 
desde b al punto más próximo p = xa es perpendicular al vector a: 


(b — xa) ± a, o bien a T (b — xa) = 0, o bien x = 


Así se obtiene la fórmula para el número x y la proyección p: 


3H La proyección del vector b sobre la recta en la dirección de a es p = xa: 


Proyección sobre una recta 


_ a T b 
p = xa = -—a. 

a l a 


Esto permite volver a trazar la figura 3.5 con una fórmula correcta para p (véase la figura 3.7). 

Lo anterior conduce a la desigualdad de Schwarz en la ecuación (6), que es la desi¬ 
gualdad más importante en matemáticas. Un caso especial es el hecho de que las medias 
aritméticas | (x + y) son más grandes que las medias geométricas Jxy. (Esto es equiva¬ 
lente -consulte el problema 1 al final de esta sección— a la desigualdad del triángulo para 
vectores.) Parece que la desigualdad de Schwarz surge casi accidentalmente de la afirmación 
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Figura 3.7 Proyección p de b sobre a, con eos 9 


Op _ a T b 
~Ob ~ Hall \\b\\ 


de que ||e|| 2 = \\b — p\\ 2 en la figura 3.7 no puede ser negativa: 


b - —a 

a 1 a 


■■ b T b - 2- 


T ( b T b)(a T a ) - ( a T b ) 2 

a a = . .: - > 0. 


Lo anterior indica que (b T b)(a T a) > ( a T b ) 2 , y luego se toman las raíces cuadradas: 





los los vectores satisfacen la desigualdad de Schwarz , que es |cos 0 | £ 1 en 


Según la fórmula (2), la razón entre cFb y ||a|| ||¿|| es exactamente |cos 6\. Debido a que 
todos los cosenos están en el intervalo -1 £ eos 9 £ 1, esto constituye otra demostración 
de la ecuación (6): la desigualdad de Schwarz es lo mismo que |cos 9 \ S 1. De alguna ma¬ 
nera es una demostración que se entiende más fácilmente debido a que los cosenos son bas¬ 
tante conocidos. Cualquier demostración está bien en R", aunque debe observar que la aquí 
proporcionada provino directamente del cálculo de ||¿> — p\\ 2 . Esto permanece no negativo 
cuando se introducen nuevas posibilidades para las longitudes y los productos intemos. El 
nombre de Cauchy también está ligado a esta desigualdad \á í b\ £ ||a|| ||¿>||, ¡y los rusos se 
refieren a ella como la desigualdad de Cauchy-Schwarz-Buniakowsky! Los historiadores 
expertos en matemáticas parecen coincidir en que la reclamación de Buniakowsky es legí¬ 
tima. 

Una observación final sobre |a T &| £ ||a|| ||£>|[. La igualdad se cumple si y sólo si b es 
un múltiplo de a. El ángulo es 9 = 0 o o 9 = 180° y el coseno es 1 o -1. En este caso b es 
idéntico a su proyección p, y la distancia entre b y la recta es cero. 


Ejemplo 1 


Proyectar b = (1, 2, 3) sobre la recta que pasa por a = ( 1, 1, 1) para obtener £ y p: 

„ _ a T b _ 6 _ 
a T a 3 

La proyección es p = xa = (2, 2, 2). El ángulo entre ay b tiene 



vn 

Vl4 


y también 


a T b __ 6 

Hall 11*11 V3VI4' 


La desigualdad de Schwarz |a T b| £ ||a|| ||2>|| es 6 < V3VT4. Si 6 se escribe como ,/36 . 
esto es lo mismo que V36 < V42- El coseno es menor que 1, ya que b no es paralelo a a. 
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Matriz proyección de rango 1 

La proyección de b sobre la recta que pasa por a está en p = a(a 7 b/a T a). Esta es nuestra 
fórmula p — xa, aunque aquí se ha escrito con un leve giro: El vector a aparece antes que 
el número x = a r b/a T a. Detrás de este cambio aparentemente trivial hay una razón. La 
proyección sobre una recta es llevada a cabo por una matriz proyección P, y escrita en es¬ 
te nuevo orden puede verse de qué se trata. P es la matriz que multiplica a b y produce p: 


de modo que la matriz proyección es P — 


Esto es una columna multiplicada por un renglón —una matriz cuadrada— dividida entre 
el número a T a. 


Ejemplo 2 La matriz que proyecta sobre la recta que pasa por a = (1, 1, l)es 


r _ r-1 1 l-i 

X i 1 3 3 3 

P = Í 1 [1 1 1] = I | |. 

3 j L J 3 3 3 

L J t -3 3 3- 

Esta matriz tiene dos propiedades que serán consideradas como típicas de las proyecciones: 

1. P es una matriz simétrica. 

2. Su cuadrado es ella misma: P 2 = P. 

P 2 b es la proyección de Pb, ¡y Pb ya está en la recta! Así, P 2 b = Pb. Esta matriz P tam¬ 
bién constituye un gran ejemplo de los cuatro subespacios fundamentales: 

El espacio columna consta de la recta que pasa por a = (1, 1, 1). 

El espacio nulo consta del plano perpendicular a a. 

El rango es r = 1. 

Toda columna es un múltiplo de a, así como también lo es Pb = xa. Los vectores que pro¬ 
yectan hacia p = 0 son especialmente importantes. Satisfacen a T b = 0 -son perpendicula¬ 
res a a y su componente a lo largo de la recta es cero. Están en el espacio nulo = plano 
perpendicular. 

En realidad, este ejemplo es demasiado perfecto. Tiene el espacio nulo ortogonal al es¬ 
pacio columna, que se ha vuelto loco. El espacio nulo debe ser ortogonal al espacio ren¬ 
glón. Pero como P es simétrica, sus espacios renglón y columna son el mismo. 

Observación sobre la escalación La matriz proyección aa T /a T a es igual a a si se duplica: 


2 proporciona P 
2 


2 [2 2 2 ] 


como antes. 


La recta que pasa por a es la misma, y eso es todo lo que le importa a la matriz proyección. 
Si la longitud de a es 1, el denominador es a T a = 1 y la matriz es justo P = aa 1 . 
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Ejemplo 3 Proyectar sobre la “dirección 8” en el plano x-y. La recta pasa por a — (eos 9, sen 9) y la 
matriz es simétrica con P 2 = P: 


;] [< -i 


Aquí, c es eos 9, s es sen 8 y c 2 + s 2 = 1 en el denominador. Esta matriz P se descubrió en 
la sección 2.6 sobre transformaciones lineales. Ahora, P se conoce en cualquier número de 
dimensiones. Se recalca que produce la proyección p: 

Para proyectar b sobre a, es necesario multiplicar la matriz proyección P:p = Pb. 


Traspuestas de productos internos 

Por último, los productos internos se relacionan con A T . Hasta el momento, A T es simple¬ 
mente la reflexión de A a través de la diagonal principal: los renglones de A se convierten 
en las columnas de A T , y viceversa. El elemento en el renglón i, columna; de A es el ele¬ 
mento 0, i) de A: 

Traspuesta por reflexión (A T ),y = (A)ji. 

Hay un significado más profundo de A T . Su estrecha relación con los productos internos 
constituye una nueva y mucho más “abstracta” definición de la traspuesta: 

3J La traspuesta A T puede definirse mediante la siguiente propiedad: el producto 
interno de Ax con y es igual al producto intemo de x con A r y. Formalmente, esto sig¬ 
nifica simplemente que 

(Ax) T y = x T A T y = x T (A T y). (8) 

Esta definición constituye otra (mejor) manera de comprobar la fórmula (AB) T = B T A r . La 
ecuación (8) se aplica dos veces: 

Primero se mueve A y luego se mueve B ( ABx) T y = (Bx) T ( A T y) = x T (B T A T y). 

La traspuesta se da vuelta en orden inverso sobre el lado derecho, justo como hacen las 
inversas en la fórmula (AB) -1 = B^'A" 1 . Se hace mención nuevamente que estasjios 
fórmulas se encuentran para producir la extraordinaria combinación (A -1 ) T = (A ) . 


Conjunto de problemas 3.2 

1. a) Dados dos números positivos cualesquiera xyy, escoja el vector b igual a ( ~Jx, Jy ), 
y escoja a = ( Jy, JP). Aplique la desigualdad de Schwarz para comparar la media 
aritmética \ (x + y) con la media geométrica Jxy. 
tí) Suponga que se empieza con un vector que va del origen al punto x , y que luego se 
suma un vector de longitud ||y|| que une x con x + y. El tercer lado del triángulo va 
del origen a x + y. La desigualdad del triángulo establece que esta distancia no 
puede ser mayor que la suma de las dos primeras distancias. 
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2 . 

3. 

4. 

5. 

6 . 

7. 

8 . 

9. 

10. 
11 . 

12 . 

13 . 


II* +y II < 11*11 + ||y||. 

Después de elevar al cuadrado ambos miembros, y desarrollar ( x + y) T (x + y), reduz¬ 
ca lo anterior a la desigualdad de Schwarz. 

Compruebe que la longitud de la proyección en la figura 3.7 es ¡Ipil = ||6|| eos#, 
aplicando la fórmula (5). 

¿Qué múltiplo de a = (1, 1, 1) está más próximo al punto b = (2, 4, 4)? También en¬ 
cuentre el punto más próximo a a sobre la recta que pasa por b. 

Explique por qué la desigualdad de Schwarz se vuelve igualdad cuando ay b están so¬ 
bre la misma recta que pasa por el origen, y sólo en ese caso. ¿Qué ocurre si están en 
lados opuestos del origen? 

En n dimensiones, ¿qué ángulo forma el vector (1, 1, . . . , 1) con los ejes de coorde¬ 
nadas? ¿Cuál es la matriz proyección P sobre ese vector? 

La desigualdad de Schwarz puede demostrarse en una línea si a y b se normalizan de¬ 
lante del tiempo para que sean vectores unitarios: 


|« T «- £!2¡L±Jí¿ 


- i +1 - Hollín. 


¿Cuál de los problemas previos justifica el paso de en medio? 

Escoja el vector correcto b en la desigualdad de Schwarz para demostrar que 

(<*!+••• +a n ) 2 < n(af + ■ • • +a 2 ). 


¿Cuándo se cumple la igualdad? 

La molécula de metano CH 4 está dispuesta como si el átomo de carbono estuviese en 
el centro de un tetraedro regular con cuatro átomos de hidrógeno en los vértices. Si los 
vértices están en (0, 0, 0), (1, 1, 0), (1, 0, 1), y (0, 1, 1) -observe que la longitud de 
todas las seis aristas es y/2, de modo que el tetraedro es regular—, ¿cuál es el coseno 
del ángulo formado por los rayos que van del centro (|, |, j) a los vértices? (El ángu¬ 
lo de enlace en sí mide aproximadamente 109.5°, un viejo conocido de los químicos.) 

Eleve al cuadrado la matriz P — aa T /a r a, que proyecta sobre una recta, y demuestre 
que P 2 = P. (¡Observe el número a T a en medio de la matriz aa T aa T \) 

La matriz proyección P, ¿es invertible? ¿Por qué? 

a) Encuentre la matriz proyección P x sobre la recta que pasa por a = * y también 

la matriz P 2 que proyecta sobre la recta perpendicular a a. L - 

b) Calcule P¡ + P 2 , P/P 2 , y explique. 

Encuentre la matriz que proyecta todo punto en el plano sobre la recta x + 2y = 0. 

Demuestre que la traza de P = aa T /a T a -que es la suma de sus elementos diagona¬ 
les— siempre es igual a 1. 
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14. ¿Cuál matriz P proyecta todo punto de R 3 sobre la recta de intersección de los planos 
x + y + t = 0yx — r = 0? 

15. Demuestre que la longitud de Ax es igual a la longitud de A T x si /L4 T = A r A. 

16. Suponga que P es la matriz proyección sobre la recta que pasa por a, 

a) ¿Por qué el producto interno de x con Py es igual al producto intemo de Px con y? 

b) ¿Son iguales los dos ángulos? Encuentre sus cosenos si a = (1, 1, — 1), x = (2, 0, 
l),yy = (2,1,2). 

c) ¿Por qué el producto interno de Px con Py siempre es el mismo? ¿Cuál es el ángu¬ 
lo entre Px y Pyl 

En los problemas 17 a 26 se piden proyecciones sobre rectas. También los errores 
e = b -p, y las matrices P. 

17. Proyecte el vector b sobre la recta que pasa por a. Compruebe que e es perpendicular 


18. Trace la proyección de b sobre a y también calcúlela a partir de p 


a) b — 


f 

= k' 


19. En el problema 17, encuentre la matriz proyección P = aa/lá/a sobre la recta que pa¬ 
sa por cada vector a. En ambos casos, compruebe que P 2 = P. Multiplique Pb en ca¬ 
da caso para calcular la proyección p. 

20. Construya las matrices proyección P x y P 2 sobre las rectas que pasan por cada vector 
a del problema 18. ¿Es cierto que (P x + P 2 ) 2 = Py + P/l Esto sería cierto si P X P 2 = 
0. 

Para los problemas 21 a 26, consulte las figuras que se muestran a continuación. 



Problemas 21 a 23 



PiP 2 o,x L 

Problemas 24 a 26 


21. Construya las matrices proyección aa T la T a sobre las rectas que pasan por a t = (—1, 
2, 2) y a 2 = (2, 2, -1). Multiplique estas matrices proyección, y explique por qué su 
producto P\P 2 es lo que es. 
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22. Proyecte b — (1, O, 0) sobre las rectas que pasan por a x y a 2 del problema 21 y tam¬ 
bién sobre a 3 = (2, —1, 2). Sume las tres proyecciones p x + p 2 + p 3 . 

23. Continuando con los problemas 21 y 22, encuentre la matriz proyección P 3 sobre a 3 = 
(2, — 1, 2). Compruebe que P x + P 2 + P 3 = I. ¡La base a x , 02 , a 3 es ortogonal! 

24. Proyecte el vector ¿ = (1,1) sobre las rectas que pasan por a x = (1, 0) y a 2 = (1, 2). 
Trace las proyecciones p x y p 2 y sume p x + p 2 . La suma de las proyecciones no es b 
porque las as no son ortogonales. 

25. En el problema 24, la proyección de b sobre el plano de a x y a 2 es igual a b. Encuentre 

P = para A = [<a 1 a 2 ] = 2 j. 

26. Proyecte a x = (1, 0) sobre a 2 = (1, 2). Luego proyecte el resultado de vuelta sobre a x . 
Trace estas proyecciones y multiplique las matrices proyección P X P 2 : ¿Ésta es una 
proyección? 

3.3 PROYECCIONES Y MÍNIMOS CUADRADOS 

Hasta el momento, Ax = b tiene una solución o no. Si b no está en el espacio columna C(A), 
entonces el sistema es inconsistente y la eliminación gaussiana fracasa. Casi seguramente, 
esta falla ocurre cuando hay muchas ecuaciones y sólo una incógnita: 

Más ecuaciones 2x = b x 

que incógnitas: 3x = ¿, 2 

¿no hay solución? 4 X = b 3 . 

Este sistema es resoluble cuando la razón entre b x , b 2 y b 3 es 2:3:4. La solución x existe só¬ 
lo si b está sobre la misma recta que la columna a = (2, 3, 4). 

A pesar de su irresolubilidad, las ecuaciones inconsistentes se presentan todo el tiem¬ 
po en la práctica. ¡Es necesario resolverlas! Una posibilidad es determinar x con base en 
una parte de ese sistema e ignorar el resto; esto es difícil de justificar si todas las m ecua¬ 
ciones vienen de la misma fuente. En vez de esperar que en algunas ecuaciones no haya 
error y que en otras el error sea grande, es mucho mejor escoger la x que minimiza un error 
promedio E en las m ecuaciones. 

El “promedio” más conveniente proviene de la suma de los cuadrados: 

Error al cuadrado E 2 = (2x — b x ) 2 + (3x — b 2 ) 2 + (4x — b 3 ) 2 . 

Si hay una solución exacta, el error mínimo es E = 0. En el caso más probable en que b no 
sea proporcional a a, la gráfica de E 2 es una parábola. El error mínimo está en el punto más 
bajo, donde la derivada es cero: 



dE 2 
dx 


= 2[(2jc — b x )2 + (3x 


¿ 2 )3 + (4x - ¿ 3 )4] = 0. 


Al despejar*, la solución por mínimos cuadrados de 
ta por x: 

Solución por mínimos cuadrados 


este sistema modelo ax = b se deno- 

^ _ 2 b x + 3b 2 + 4¿>3 a T b 
2 2 4- 3 2 -h 4 2 a?a 


En el numerador se reconoce a T b, y en el denominador, a T a. 


El caso general es el mismo, ax = b se “resuelve” al minimizar 


E 2 = II ax - ¿|| 2 = ( a x x - b x ) 2 + ■■■ + ( a m x - b m ) 2 . 


U ?' i V i?. n ; 


ACIONAt 
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La derivada de E 2 es cero eii'él 

{a{x — b x )a x + ■ ■ ■ +(a m x — b m )a m = 0. 

Se está minimizando la distancia de b a la recta que pasa por a, y en cálculo se obtiene 
la misma respuesta, x = (a x b x + ■ ■ ■ +a m b m )/( a\ + • • - +a 2 ), que se obtuvo antes con 
la geometría: 

3K La solución por mínimos cuadrados de un 


Puede darse cuenta de que seguimos regresando a la interpretación geométrica de un 
problema de mínimos cuadrados: minimizar una distancia. Al igualar a cero la derivada de 
É 1 , el cálculo confirma la geometría de la sección previa. El vector error e que une b con 
p debe ser perpendicular a a: 


Ortogonalidad deaye a T (b — xa) = a T b — 


-a T a = 0. 


Como observación al margen, observe el caso degenerado a = 0. Todos los múltiplos 
de a son cero, y la recta es sólo un punto. En consecuencia, p = 0 es el único candidato pa¬ 
ra la proyección. Sin embargo, la fórmula para x se convierte en una expresión 0/0 sin sen¬ 
tido, y correctamente refleja el hecho de que ? está completamente indeterminado. Todos 
los valores de x proporcionan el mismo error E = ||0x — ¿||, de modo que E 2 es una recta 
horizontal en vez de una parábola. La “seudoinversa” asigna el valor definitivo x = 0, que 
es una elección más “simétrica” que cualquier otra. 


Problemas de mínimos cuadrados con varias variables 

Ahora ya estamos listos para dar un paso importante: proyectar b sobre un subespacio -en 
vez de hacerlo simplemente sobre una recta. Este problema se presenta de Ax = b cuando 
A es una matriz de m por n. En vez de una columna y una incógnita x, ahora la matriz tie¬ 
ne n columnas. El número m de observaciones sigue siendo mayor que el número n de in¬ 
cógnitas, por lo que es de esperar que Ax = b sea inconsistente. Quizá no haya una elección 
de x que se ajuste perfectamente a los datos b. En otras palabras, probablemente el vector 
b no sea una combinación de las columnas de A; está fuera del espacio columna. 

De nuevo el problema es escoger x con la finalidad de minimizar el error, y de nuevo 
esta minimización se hace en el sentido de mínimos cuadrados. El error es E = ||Ax - ¿>l¡, v 
es exactamente la distancia de b al punto Ax en el espacio columna. Buscar la solución 
por mínimos cuadrados x, que minimiza E, es lo mismo que ubicar el punto p = Ax que 
está más próximo a b que cualquier otro punto en el espacio columna. 

Para determinar x puede usarse geometría o cálculo. En n dimensiones es preferible 
utilizar geometría; p debe ser la “proyección de b sobre el espacio columna . El vector 
error e = b — Ax debe ser perpendicular a ese espacio (véase la figura 3.8). Encontrar 
x y la proyección p = Ax es tan fundamental que se hace de dos maneras: 

1. ' Todos los vectores perpendiculares al espacio columna están en el espacio nulo iz¬ 
quierdo. Así, el vector error e — b — Ax debe estar en el espacio nulo de A : 

A t (¿ — Ax) =0 o bien A T Ax = A T b. 
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columna a x 


se combinan en 
A T e = A T (b — Ax) — 0 


columna <22 


Figura 3.8 Proyección sobre el espacio columna de una matriz de 3 por 2. 


2. El vector error debe ser perpendicular a cada columna a 


Esto es nuevamente A T (b - Ax) = 0 y A T Ax = A r b. El método del cálculo consis¬ 
te en tomar derivadas parciales de E 2 = (Ax - b) r (Ax - fe). Así se obtiene lo mismo 
que 2A r Ax - 2 A T b = 0. La forma más rápida es multiplicar la ecuación irresoluble Ax 
= b por A T . Con todos estos métodos equivalentes se obtiene una matriz de coeficientes 
cuadrada A T A. Es simétrica (¡su traspuesta no es AA T !) y es la matriz fundamental de este 
capítulo. 

En estadística, las ecuaciones A T Ax = A T fe se conocen como ecuaciones normales. 


Ecuaciones normales A T Ax = A T fe. (1) 

¡A t A es invertible exactamente cuando las columnas de A son linealmente indepen¬ 
dientes! Así, 

Mejor estimación x x = (A r A)~ l A r b. . (2> 

La proyección de b sobre el espacio columna es el punto más próximo A x : 

Proyección p = Ax = A(A T A)~ ! A T b. (3) 


Se escoge un ejemplo en donde nuestra intuición es tan buena como las fórmulas: 


Ax = b no tiene solución 

A T Ax = A T fe proporciona la mejor x. 


Ambas columnas terminan con un cero, de modo que C(A) es el plano 
ció tridimensional. La proyección de b = (4, 5, 6) es p = (4, 5, 0); las - 
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permanecen ig ual pero z = 6 desaparece. Este hecho lo confirman las ecuaciones normales: 


1 1 0 ' 
2 3 0 


x = (A t A) 1 A T fe 


-5] [1 1 0' 

2 2 3 0 


Proyección 


En este caso especial, lo mejor que puede hacerse es resolver las dos primeras ecuaciones 
de Ax = fe. Así, x t = 2 y x 2 = 1. Es seguro que el error en la ecuación 0x x + 0x 2 = 6 es 
el 6. 

Observación 1 Suponga que b está realmente en el espacio columna de A: es una combi¬ 
nación b = Ax de las columnas. Entonces, la proyección de b sigue siendo b: 




El punto p más próximo es justo b mismo, lo cual es evidente. 

Observación 2 En el otro extremo, suponga que b es perpendicular a cada columna, de 
modo que A r b = 0. En este caso b se proyecta al vector cero: 

b en el espacio nulo izquierdo p = A(A T A) -1 A T fe = A(A T A)~’0 = 0. 

Observación 3 Cuando A es cuadrada e invertible, el espacio columna es todo el espacio. 
Cada vector se proyecta en sí mismo, p es igual a fe, y x = x :. 

Si A es invertible p = A(A T A) -1 A T fe = AA~ 1 (A T )~ I A T fe = fe. 

Este es el único caso en que es posible separar (A T A) -1 , y escribirla como A _! (A T ) 
Cuando A es rectangular esto no es posible. 

Observación 4 Suponga que A sólo tiene una columna, que contiene a a. Entonces la ma¬ 
triz A t A es el número ci T a y x es a T b/a T a. Se regresa a la primera fórmula. 


La matriz producto cruz A 1 A 

La matriz A T A es ciertamente simétrica. Su traspuesta es (A T A) T = A T A Tr , que es A r A de 
nuevo. Su elemento ij (y el elemento j, i) es el producto interno de la columna i de A con 
la columna j de A. La cuestión clave es la invertibilidad de A T A, y por fortuna 



Ciertamente, si Ax = 0, entonces A T Ax = 0. Los vectores x en el espacio nulo de A también 
están en el espacio nulo de A T A. Para ir en la otra dirección, debe empezarse suponiendo 
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que A t Ax = 0, y tomar el producto interno con x para demostrar que Ax = 0: 

x r A r Ax = 0, obien, ||Ax|| 2 =0, obien, Ax =0. 

Los dos espacios nulos son idénticos. En particular, si las columnas de A son independien¬ 
tes (y sólo x = 0 está en su espacio nulo), entonces lo mismo es cierto para A T A: 

3M Si A tiene columnas independientes, entonces A r A es cuadrada, simétrica e in¬ 
vertible. 

Después se demostrará que A T A también es positiva definida (todos los pivotes y los valo¬ 
res característicos son positivos). 

Este caso es por mucho el más común e importante. La independencia no es tan difí¬ 
cil en un espacio m-dimensional si m > n. Esto se supone de aquí en adelante. 

Matrices proyección 

Se ha demostrado que el punto más próximo abes p = A( A r A) ~ l A T b. Esta fórmula ex¬ 
presa en términos matriciales la construcción de una recta perpendicular de b al espacio 
columna de A. La matriz que proporciona P es una matriz proyección, denotada por P: 

Matriz proyección P = A( A r Á)~ l Á r , (4) 


Esta matriz proyecta cualquier vector b sobre el espacio columna de A.* En otras palabras, 
p = Pb es la componente de b en el espacio columna, y el error e = b - Pb es la compo¬ 
nente en el complemento ortogonal. (¡/— P también es una matriz proyección! Proyecta b 
sobre el complemento ortogonal, y la proyección es b - Pb.) 

En breve, se tiene una fórmula matricial para separar cualquier b en dos componentes 
perpendiculares. Pb está en el espacio columna C(A), y la otra componente ( l-P)b está en 
el espacio nulo izquierdo N(A r ), que es ortogonal al espacio columna. 

Las matrices proyección pueden entenderse geométrica y algebraicamente. 


3N La matriz proyección P = A(A T 
i) Es igual a su cuadrado: P 2 - P 
ii) Es igual a su traspuesta: P T = i 
AI revés, cualquier matriz simétrica con 



Demostración Es fácil ver por qué P 2 — P. Si se empieza con cualquier b, entonces Pb 
está en el subespacio sobre el que se está proyectando. Cuando se vuelve a proyectar na¬ 
da cambia. El vector Pb ya está en el subespacio, y P(Pb) sigue siendo Pb. En otras pala¬ 
bras, P 2 = P . Dos o tres o cincuenta proyecciones proporcionan el mismo punto p que la 
primera proyección: 


P 2 = A{A t A) 1 A t A(A t A) *A t = A(A T A)~‘A T = P. 


Puede haber un riesgo de confusión con las matrices permutación, que también se denotan por P, aunque el ries¬ 
go debe ser pequeño, y trataremos que nunca aparezcan ambas en la misma página. 
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Para demostrar que P también es simétrica, se toma su traspuesta. Las traspuestas se 
multiplican en orden invertido, y se usa la simetría de (A T A)~\ para regresar a P: 

P T = (A t ) t ((A t A)' 1 ) t A t = A((A t A) t )“‘A t = A{A t A)~'A t = P. 

Para la conversa, a partir de P 2 = P y P T = P es necesario deducir que Pb es la pro¬ 
yección ortogonal de b sobre el espacio columna de P. El vector error b - Pb es ortogo¬ 
nal al espacio. Para cualquier vector Pe en el espacio, el producto interior es cero: 

(b - PbfPc = b T {I - P) T Pc — b T ( P — P 2 )c = 0. 

Así, b-Pbes ortogonal al espacio, y Pb es la proyección sobre el espacio columna. ■ 

Ejemplo 1 Suponga que A es verdaderamente invertible. Si es de 4 por 4, entonces sus cuatro colum¬ 
nas son independientes y su espacio columna es todo R 4 . ¿Cuál es la proyección sobre to¬ 
do el espacio ? Es la matriz identidad. 

P = A(A T Ar‘A T = AA~ i (A t )~'A t = /. (5) 

La matriz identidad es simétrica, 7 2 = I, y el error b - Ib es cero. 

La cuestión con todos los otros ejemplos es que lo que ocurrió en la ecuación (5) no 
se permite. Para repetir: No es posible invertir las partes por separado A T y A cuando estas 
matrices son rectangulares. La que es invertible es la matriz A T A. 

Ajuste de datos por mínimos cuadrados 

Suponga que se realiza una serie de experimentos, y se espera que la salida b sea una fun¬ 
ción lineal de la entrada t. Se busca una línea recta b — C + Dt. Por ejemplo: 

1. En instantes diferentes se mide la distancia a un satélite en su camino a Marte. En es¬ 
te caso t es el tiempo y b es la distancia. A menos que el motor esté encendido o la gra¬ 
vedad sea intensa, el satélite se moverá casi a velocidad constante v: b = b 0 + vt. 

2. En una estructura se hace variar la carga, y se mide el movimiento que esto produce. 
En este experimento t es la carga y b es la lectura en el medidor de deformación. 
A menos que la carga sea tan grande que el material se vuelva plástico, en la teoría de 
la elasticidad es normal una relación lineal b = C + Dt. 

3. El costo de producción de t libros como éste es casi lineal, b = C + Dt, con la edición 
y la composición en C y luego la impresión y la encuademación en D. Así, C es el cos¬ 
to de preparación y D es el costo por cada libro adicional. 

¿Cómo calcular C y Z>? Si no hay error experimental, entonces dos mediciones de b 
determinan la recta b = C + Dt. Pero si hay error, es necesario estar preparado para “pro¬ 
mediar” los experimentos y encontrar una recta óptima. ¡Esta recta no debe confundirse 
con la recta que pasa por a sobre la cual se proyectó b en la sección previa! De hecho, ya 
que hay dos incógnitas por determinar: C y D, ahora se proyecta sobre un subespacio bidi- 
mensional. Un experimento perfecto debe proporcionar una C y una D perfectas: 
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C + Dt\ — b\ 

C + Dt 2 = ¿>2 

. ( 6 ) 

C + Dt m = b m . 

Este es un sistema sobredeterminado, con m ecuaciones y sólo dos incógnitas. Si hay erro¬ 
res presentes, el sistema no tiene solución. A tiene dos columnas, y x = (C, D): 

bi 

b z 

o bien, Ax = b. (7) 


La mejor solución (C, D) es la x que minimiza el error al cuadrado E 2 : 

Minimizar E 1 = || b — Ax || 2 = (b\ — C — Dt x ) 2 + • • • +(b m — C — Dt m ) 2 . 

El vector p = Ax está lo más próximo posible a b. De todas las rectas b = C + Dt, se es¬ 
tá eligiendo la que mejor se ajusta a los datos (véase la figura 3.9). En la gráfica, los erro¬ 
res son las distancias verticales b — C — Dt a la recta (¡no son distancias perpendiculares!) 
Son las distancias verticales las que se elevan al cuadrado, se suman, y minimizan. 



a) b ) 


Figura 3.9 La aproximación por una recta corresponde a la proyección p de b. 

Ejemplo 2 En la figura 3.9a se muestran tres mediciones b u b 2 , b z . 

b = 1 en t = — 1 , b = 1 en t = 1 , b ~ 3 en t — 2. 

i 

Observe que no se requiere que los valores t = -1, 1,2 sean equidistantes. El primer pa- j 

so es escribir las ecuaciones que se cumplirían si una recta pudiera pasar por todos los 

tres puntos. | 
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Entonces C + Dt coincidiría exactamente con b: 


C - D = 1 

Ax — b es C + D — lo bien 
C 4- 2Z> = 3 




Si estas ecuaciones Ax = b pudieran resolverse, no habría errores. No es posible resolver¬ 
las porque los puntos no están en una recta. En consecuencia, se resuelven por mínimos 
cuadrados: 


A r Ax = A r b es 




La mejor solución esC = |,D = |,yla mejor recta es | 4- |í. 


Observe las hermosas relaciones entre las dos figuras. El problema es el mismo pero 
el arte lo muestra distinto. En la figura 3.9 b, b no es una combinación de las columnas 
(1, 1, 1) y (—1, 1, 2). En la figura 3.9, los tres puntos no están sobre una recta. ¡Los míni¬ 
mos cuadrados sustituyen los puntos b que no están sobre una recta por puntos p que sí es¬ 
tán! Al no ser posible resolver Ax = b, se resuelve Ax = p. 

La recta | + 1 1 tiene alturas |, y y y en los instantes de medición -1, 1, 2. Estos 
puntos están sobre una recta. En consecuencia, el vector p = (y. y, y) está en el espa¬ 
cio columna. Este vector es la proyección. La figura 3.9 b está en tres dimensiones (o en m 
dimensiones si hay m puntos) y la figura 3.9a está en dos dimensiones (o en n dimensio¬ 
nes si hay n parámetros). 

Al restar p de b, los errores son e = (|, —y ~). Estos son los errores verticales en la 
figura 3.9a, y son las componentes del vector discontinuo de la figura 3.9 b. Este vector 
error es ortogonal a la primera columna (1, 1, 1), ya que | — | 4-1 = 0. Es ortogonal a la 

segunda columna (—1, 1, 2) porque — | — f + f = 0. Es ortogonal al espacio columna, 
y está en el espacio nulo izquierdo. 

Pregunta: Si las mediciones b = (|, —|) fuesen estos errores, ¿cuál sería la mejor 
recta y el mejor 3c ? Respuesta: La recta cero, que es el eje horizontal, y x = 0. Proyección 
a cero. 

Fácilmente pueden resumirse las ecuaciones para ajustar una recta. La primera colum¬ 
na de A contiene a los ls y la segunda columna a los tiempos t¡. En consecuencia, A r A con¬ 
tiene a la suma de los ls y los t¡, así como a tf: 


30_ Lay medie iones b x ,... ,b m están dadas a puntos distintos t l7 , t m . Así, la rec¬ 
ta C + Dt que minimiza E 2 proviene de mínimos cuadrados: 


A~b o bien. 


e ,1 reí íeH 


£<í £>?J |8j |£iaJ' 


Observación Las matemáticas de los mínimos cuadrados no están limitadas a ajustar los 
datos por rectas. En muchos experimentos no hay razón para esperar una relación lineal, y 
no tendría sentido buscar una. Suponga que se manipula material radiactivo. La salida b es 
la lectura de un contador Geiger en varios instantes t. Podría saberse que se está trabajan¬ 
do con una mezcla de dos productos químicos, de los cuales se conocen sus vidas medias 
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(o tasas de desintegración), aunque se ignora la cantidad que se está manipulando de cada 
producto. Si estas dos cantidades desconocidas son C y D, entonces las lecturas del conta¬ 
dor Geiger se comportarían como la suma de dos exponenciales (y no como una recta): 

b = Ce~ x ‘ + De” 1 *. (8) 

En la práctica, el contador Geiger no es exacto. En vez de ello, se toman lecturas 
b x ,...,b m en los instantes t x , . . . , t m , y la ecuación (8) se cumple aproximadamente: 

Ce~ Xtx + De'^' « bi 
Ax = b es : 

Ce~ Xtm + De~ lí ‘ m b m . 

Si hay más de dos lecturas, m > 2, entonces con toda probabilidad no es posible re¬ 
solver para C y D. Sin embargo, el principio de mínimos cuadrados proporciona valores 
óptimos C y D. 

La situación sería completamente diferente si se conocieran las cantidades C y D, y 
estuviera intentándose descubrir las tasas de desintegración Xy/r. Este es un problema de 
mínimos cuadrados no lineales, y es más difícil. Sin embargo, aún se forman É 1 , y la su¬ 
ma de los cuadrados de los errores, y se minimizan. Pero igualar a cero las derivadas no 
proporciona ecuaciones lineales para las X y p. óptimas. En los ejercicios sólo se conside¬ 
ran mínimos cuadrados lineales. 


Mínimos cuadrados ponderados 

Un problema sencillo de mínimos cuadrados es estimar x del peso de un paciente a partir 
de dos observaciones, x = b x y x — b 2 . A menos que b x = b 2 , la situación supone resolver 
un sistema inconsistente de dos ecuaciones en una incógnita: 



Hasta el momento, b x y b 2 se han aceptado como igualmente confiables. Se buscaba el va¬ 
lor x que minimizaba E 2 = (x — b¡) 2 + (x — b->) 2 : 



El x óptimo es el promedio. La misma conclusión se obtiene a partir de A T Ax = A T b ■ De 
hecho, A t A no es una matriz de 1 por 1, y la ecuación normal es 2x = b¡ + b 2 . 

Ahora se supone que dos observaciones no son confiables en la misma medida. El va¬ 
lor x = b x puede obtenerse a partir de una escala más precisa, o bien, en un problema es¬ 
tadístico, de una muestra más grande, que x = b 2 . A pesar de ello, si b 2 contiene alguna 
información, no es aconsejable depender totalmente de b x . El compromiso más sencillo es 
asignar valores distintos wf y u>|, y escoger x w que minimice la suma ponderada de cua¬ 
drados: 


Error ponderado E 2 = w x (x ~ b¡) 2 + w\(x — b 2 ) 2 . 


Si w¡ > w 2 , entonces a b x se asigna mayor importancia. El proceso de minimización (de¬ 
rivada = 0) intenta con mayor ahínco hacer pequeño a (x - b x ) 2 : 
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Ejemplo 3 


En vez del promedio de b x y b 2 (para w x = w 2 = 1), x w es un promedio ponderado de 
los datos. Este promedio está más próximo de b x que de b 2 . 

El problema normal de mínimos cuadrados que llevaba a x w proviene de cambiar 
Ax = b al nuevo sistema WAx = Wb. Con esto, la solución cambia de x a x w .L& matriz 
W T W se voltea sobre ambos lados de las ecuaciones normales ponderadas: 


La solución por mínimos cuadrados de WAx — Wb es x w : 


Ecuaciones normales ponderadas: (/l T W T WA)x\ 


r W T Wb. 


¿Qué ocurre con la representación de b proyectada en Ax? La proyección Ax w sigue 
siendo el punto en el espacio columna más próximo a b. Pero la expresión “más próximo” 
adquiere un nuevo significado cuando la longitud implica a W. La longitud ponderada de x 
es igual a la longitud ordinaria de Wx. Perpendicularidad ya no significa y T x = 0; en el nue¬ 
vo sistema la prueba es (Wy) T (Wx) = 0. La matriz W r W aparece en medio. En este nuevo 
sentido, la proyección Axw y el error b — Ax w nuevamente son perpendiculares. 

El último párrafo describe todos los productos internos : provienen de matrices inver- 
tibles W. Sólo implican a la combinación simétrica C = W T W. El producto interno de x y 
y es y T Cx. Para una matriz ortogonal W = Q, cuando esta combinación es C = Q r Q = I, 
el producto intemo no es nuevo o diferente. La rotación del espacio deja sin cambio al pro¬ 
ducto intemo. Cualquier otra W cambia la longitud y el producto intemo. 


Para cualquier matriz invertible W, estas reglas definen un nuevo producto intemo y una 
nueva longitud: 

Ponderado por TE (x, y) w = (Wy) J {Wx) y \\x\\w = \\Wx\\. (10) 


Debido a que W es invertible, a ningún vector se asigna la longitud cero (excepto al vector 
cero). Todos los productos intemos posibles — que dependen linealmente de x y y — son po¬ 
sitivos cuando x = y # 0, y se encuentran de esta manera, para alguna matriz C — W T W. 

En la práctica, la cuestión importante es la elección de C. La mejor respuesta provie¬ 
ne de los expertos en estadística, originalmente de Gauss. Puede saberse que el error me¬ 
dio es cero. Este es el “valor esperado” del error en b, ¡aunque en realidad se espera que el 
error no sea cero! También es posible conocer el promedio del cuadrado del error; ésta es 
la varianza. Si los errores en las b¿ son independientes entre sí, y sus varianzas son cr?, en¬ 
tonces los pesos correctos son w¡ = 1/a, . Una medición más precisa, que significa menor 
varianza, obtiene un mayor peso. 

Además de tener confiabilidad desigual, las observaciones pueden no ser indepen¬ 
dientes. Si los errores vienen por parejas -las encuestas para presidente no son indepen¬ 
dientes de las encuestas para senador, y ciertamente tampoco de las encuestas para 
vicepresidente— entonces W tiene términos fuera de la diagonal. La mejor matriz no ses¬ 
gada C = W T W es la inversa de la matriz de covarianza, cuyo elemento i, j es el valor es¬ 
perado de (error en b¡) multiplicado por (error en b¡). Entonces, la diagonal principal de C ~ 1 
contiene a las varianzas crf, que son el promedio de (error en b¡) 2 . 

Suponga que dos compañeros en una partida de bridge conjeturan (después de pujar) la 
cantidad de picas que tienen. Para cada conjetura, los errores —1,0, 1 pueden tener la mis¬ 
ma probabilidad, i. Así, el error esperado es cero y la varianza es |: 

E{e) = f(-l) + i(0) + |(1) =0 
E(e 2 ) = i(-l) 2 + i(0) 2 + i(l) 2 = f. 


I 
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Las dos conjeturas son dependientes, porque están basadas en la misma puja, pero no son 
idénticas, porque los compañeros tienen manos distintas. Considere que la posibilidad de 
que los compañeros tengan muchas picas o tengan pocas picas es cero, pero que la posi¬ 
bilidad de errores opuestos es |. Entonces £’(e l e 2 ) = j(~ 1), y la inversa de la matriz de 
covarianza es W T W: 


E(e f) E(ete 2 )l 1 

E(e x e 2 ) E(<?f) 




= c = W T W. 


Esta matriz va en medio de las ecuaciones normales ponderadas. 


SU Conjunto de problemas 3.3 

1. Encuentre la mejor solución por mínimos cuadrados x de 3x = 10, 4x = 5. ¿Cuál es 
el error E 2 que se minimiza? Compruebe que el vector error (10 — 33t, 5 — 43c) es 
perpendicular a la columna (3, 4). 

2. Suponga que los valores b { = 1 y b 2 = 7 multiplicados por t¡ = 1 y f 2 = 2 son ajus¬ 
tados por una recta b = Dt que pasa por el origen. Resuelva D — 1 y 2Z3> = 7 por mí¬ 
nimos cuadrados. Dibuje la mejor recta. 

3. Resuelva Ax = b por mínimos cuadrados, y encuentre p = Ax si 



'1 

0' 


T 

A = 

0 

1 

, b = 

1 


1 

1 


0 


Compruebe que el error b - p es perpendicular a las columnas de A. 

4. Escriba E 2 — II Ax — ¿>ll 2 e iguale a cero sus derivadas respecto de u y v, si 

'l 0‘ 

A = 0 1 , x = 

1 1 

Compare las ecuaciones resultantes con A t A3c = A J b, confirmando que el cálculo, 
así como la geometría, proporcionan las ecuaciones normales. Encuentre la solución 
x y la proyección p = Ax . ¿Por qué p = b? 

5. El siguiente sistema no tiene solución: 



Dibuje y resuelva un ajuste por una recta que lleve a la minimización de la cuadrática 
(C — D — 4) 2 + (C — 5) 2 + (C + D — 9) 2 - ¿Cuál es la proyección de b sobre el 
espacio columna de A? 

6. Encuentre la proyección de b sobre el espacio columna de A: 

1 ll [1 

A = 1 -1 , b = 2 

-2 4J [7 
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Separe benp + q, con p en el espacio columna y q perpendicular a este espacio. ¿Cuál 
de los cuatro subespacios contiene a q c ! 

7. Encuentre la matriz proyección P sobre el espacio generado por a x = (1, 0, 1) y = 
(1, 1,-1). 

8. Si P es la matriz proyección sobre un subespacio ^-dimensional S de todo el espacio 
R”, ¿cuál es el espacio columna de P, y cuál es su rango? 

9. a) Si P = P T P, demuestre que P es una matriz proyección. 
b) ¿Sobre qué subespacio proyecta la matriz P — 0? 

10. Si los vectores a x , a 2 , y b son ortogonales, ¿cuáles son A T A y A x £>? ¿Cuál es la pro¬ 
yección de b sobre el plano de a¡ y a 2 ? 

11. Suponga que P es la matriz proyección sobre el subespacio S y que Q es la matriz pro¬ 
yección sobre los complementos ortogonales S x . ¿Cuáles son P + Q y PQ1 Demues¬ 
tre que P — Q es su propia inversa. 

12. Si V es el subespacio generado por (1, 1, 0, 1) y (0, 0, 1, 0), encuentre 

a) Una base para el complemento ortogonal V x . 

b) La matriz proyección P sobre V. 

c) El vector en V más próximo al vector ¿> = (0, 1,0, —1) en V x . 

13. Encuentre el mejor ajuste por una recta (mínimos cuadrados) de las mediciones 

b = 4 en t = —2, b = 3 en t — — 1, 

b — 1 en t = 0, b = 0 en t = 2. 

Luego encuentre la proyección de b = (4, 3, 1, 0) sobre el espacio columna de 

'1 — 2 " 

A = 1 - 1 

A 1 0 ' 

_1 2_ 

14. Los vectores a, — (1, l,0)ya 2 = (1, 1, 1) generan un plano en R 3 . Encuentre la ma¬ 
triz proyección P sobre el plano, y encuentre un vector b diferente de cero que sea pro¬ 
yectado en cero. 

15. Si P es la matriz proyección sobre una recta en el plano x-y, dibuje una figura para des¬ 
cribir el efecto de la “matriz reflexión” H = / - 2 P. Explique geométrica y algebrai¬ 
camente por qué H 2 — I. 

16. Demuestre que si la longitud de u es uno, entonces la matriz P = uu r de rango 1 es 
una matriz proyección: tiene las propiedades i) y ii) enunciadas en 3N. Si se escoge 
u = al \\a ||, P se convierte en la matriz proyección sobre la recta que pasa por ¡ 2 , y Pb 
es el punto p = xa. Las proyecciones de rango 1 corresponden exactamente a proble¬ 
mas de mínimos cuadrados en una incógnita. 

17. ¿Qué matriz de 2 por 2 proyecta el plano x-y sobre la recta de 45° x + y = 0? 

18. Se quiere ajustar un plano y — C + Dt + Ez para los cuatro puntos 

y=3 en t — 1, z — 1 y=6 en í = 0, z = 3 

y = 5 en t = 2, z = 1 y = 0 en t — 0, z — 0. 
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a) Encuentre 4 ecuaciones en 3 incógnitas para hacer pasar un plano por los puntos 
(en caso de que tal plano exista). 

b ) Encuentre 3 ecuaciones en 3 incógnitas para la mejor solución por mínimos cua¬ 
drados. 

19. Si P c — A(A T A)~ 1 A t es la proyección sobre el espacio columna de A, ¿cuál es la pro¬ 
yección P R sobre el espacio renglón? (¡No es Pj!) 

20. Si P es la proyección sobre el espacio columna de A, ¿cuál es la proyección sobre el 
espacio nulo izquierdo? 

21. Suponga que L t es la recta que pasa por el origen en la dirección de a l y que Lj es I a 
recta que pasa por b en la dirección de a 2 . Para encontrar los puntos más próximos x 1 a l 
y b + x 2 a 2 sobre las dos rectas, escriba las dos ecuaciones para x t y x 2 que minimizan 
llrqai -x 2 a 2 —b ||. Resuelva parar si a x = (1, 1, 0), a 2 = (0, 1, 0), b = (2, 1, 4). 

22. Encuentre la mejor recta C + Dt para ajustar b = 4, 2, —1, 0, 0 en los instantes t = 
-2,-1,0, 1,2. 

23. Demuestre que el mejor ajuste por mínimos cuadrados a un conjunto de mediciones 
y 2 , ■ ■ ■ , y m P or una recta horizontal (una función constante y — Q es su promedio 

C = yi + " ' +ym 
m 

24. Encuentre el mejor ajuste por una recta a las siguientes mediciones, y dibuje su solución: 

y = 2 en t = -1, y = 0 en t = 0, 

y — — 3 en t = 1, y = — 5 en ( = 2. 

25. Suponga que en vez de, por medio de una recta, los datos del problema 24 se ajustan 

por una parábola: y = C + Dt + Et 2 . En el sistema inconsistente Ax — b proveniente 
de las cuatro mediciones, ¿cuáles son la matriz de coeficientes A, el vector desconoci¬ 
do x, y el vector de datos ¿>? No es necesario calcular x. 

26. Bajo tortura, una persona de la Edad Media fue alargada las longitudes L = 5, 6, y 7 
pies bajo fuerzas aplicadas de F = 1, 2, y 4 toneladas. Suponga la ley de Hooke L = 
a + bF para encontrar por mínimos cuadrados la longitud normal a de la persona. 

En los problemas 27 a 31 se presentan los conceptos básicos de la estadística: la base 
de los mínimos cuadrados. 

27. (Recomendado) Este problema proyecta b = (¿q,..., b m ) sobre la recta que pasa por 
a = (1, • • • , 1). Se resuelven m ecuaciones ax = b en 1 incógnita (por mínimos cua¬ 
drados). 

a) Resuelva a T ax = a T b para demostrar que x es la media (el promedio) de las bs. 

b) Encuentre e = b — ax, la varianza \\e\\ 2 , y la desviación estándar ||e|¡. 

c) La recta horizontal b = 3 es la más próxima a b = (1, 2, 6). Compruebe que p = 
(3, 3, 3) es perpendicular a e, y encuentre la matriz proyección P. 

28. Primera suposición detrás de los mínimos cuadrados: La media de cada error de me¬ 
dición es cero. Multiplique los 8 vectores error b - Ax = (±1. ±1. ±1) por 
(A T A) 1 A t para demostrar que el promedio de los 8 vectores x — x también es cero. 
La estimación x es insesgada. 

29. Segunda suposición detrás de los mínimos cuadrados: Los m errores e¡ son indepen 
dientes de la varianza a 2 , de modo que el promedio (b - Ax )( b - Ax) T es O 2 !. Multi¬ 
plique por la izquierda por (A T A) _l A T y por la derecha por A(A T A) _1 para demostrar 
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que el promedio de (x — x)(x — x) T es a 2 (A T A) -1 . Esta es la fundamental matriz de 
covarianm para el error en x. 

30. Un doctor toma 4 lecturas del ritmo cardiaco de una persona. La mejor solución de 
x = ¿q,. .. , x = ¿> 4 es el promedio x de b x ,..., ¿> 4 . La matriz A es la columna de Is. 
En el problema 29 se proporciona el error esperado (x — x) 2 como cr 2 (A T A)~" 1 = 
_. Al promediar, la varianza cae desde a 2 hasta o 1 !A. 

31. Si se conoce el promedio x 9 de 9 números b x ,... ,b 9 , ¿cuán rápido puede encontrarse 
el promedio xj 0 con un número más b 10 ? La idea de mínimos cuadrados recurrentes es 
evitar la suma de 10 números. ¿Qué coeficiente de % proporciona correctamente x 10 ? 

xio = -fíjbio + _ x 9 = jg(b i + • - • +¿>io). 

En los problemas 32 a 37, use cuatro puntos b = (0,8,8,20) para producir ideas nuevas. 

32. Con b = 0, 8, 8, 20 en t = 0, 1, 3, 4, escriba y resuelva las ecuaciones normales 
A J Ax = A J b ■ Para la mejor recta como en la figura 3.9a, encuentre sus cuatro altu¬ 
ras p¡ y sus cuatro errores e¡. ¿Cuál es el valor mínimo E 2 = e\ + e\ + e\ + ej? 

33. (La recta C + Dt pasa por los ps). Con b = 0, 8, 8, 20 en los tiempos t = 0, 1, 3, 4, 
escriba las cuatro ecuaciones Ax = b (irresoluble). Cambie las mediciones a p — 1,5, 
13, 17 y encuentre una solución exacta de Ax = P ■ 

34. Compmebe que e = b -p = (— 1, 3, -5, 3) es perpendicular a ambas columnas de A. 
¿Cuál es la distancia más corta j|e|¡ de b al espacio columna de A? 

35. Para la parábola más próxima b = C + Dt + Et 2 a los mismos cuatro puntos, es¬ 
criba las ecuaciones irresolubles Ax = b en tres incógnitas x = (C, D, £). Escriba las 
tres ecuaciones normales A T Ax = A T b (no se requiere su solución). Ahora se está 
ajustando una parábola a los cuatro puntos; ¿qué ocurre en la figura 3.9 b? 

36. Para la cúbica más próxima b = C + Dt + Et 2 + Ft 3 a los mismos cuatro puntos, 
escriba las cuatro ecuaciones Ax = b. Resuélvalas por eliminación. Ahora, esta cúbi¬ 
ca pasa exactamente por los puntos. ¿Cuáles son p y el 

37. El promedio de los cuatro tiempos es t = j(0 + 1 + 3 + 4) = 2.. El promedio de 
las cuatro bs es b = |(0 + 8 + 8 + 20) = 9. 

a) Compruebe que la mejor recta pasa por el punto central (t, b) = (2, 9) • 

b ) Explique por qué C + D? = b proviene de la primera ecuación en A T Ax = A T b. 

38. ¿Qué ocurre con el peso ponderado x w = (w 2 b\ + w\b 2 )/ (tu 2 + w 2 ) si el primer pe¬ 
so uq tiende a cero? La medición b x es completamente desconfiable. 

39. A partir de m mediciones independientes b x , ... ,b m del pulso de una persona, pon¬ 
deradas por uq,.... w m , ¿cuál es el promedio ponderado que sustituye a la ecuación 
(9)? La respuesta es la mejor estimación cuando las varianzas estadísticas son 

O} 2 = l/wj. 

40. Si W — j^Q ° j, encuentre el producto intemo de x = (2, 3) y y = (1, 1), así como 
la longitud W de x. ¿Qué recta de vectores es W-perpendicular a yl 

41. Encuentre la solución ponderada por mínimos cuadrados x w de Ax = b: 
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'1 Oí [0] [2 O O" 

A = 1 1 b = 1 W = O 1 O . 

1 2j [1] L° 0 l . 

Compruebe que la proyección Ax w sigue siendo perpendicular (¡en el producto inter¬ 
no WT) al error b — Áxw- 

42. a ) Suponga que usted adivina la edad de su profesor, cometiendo errores e = — 2 , — 1 , 
5, con probabilidades j, i Compruebe que el error esperado E(e ) es cero, y 
encuentre la varianza E(e 2 3 ). 

b) Si también el profesor adivina (o intenta recordar), cometiendo errores —1, 0, 1, 
con probabilidades i |, |, ¿qué pesos w¡ y w 2 proporcionan la confiabilidad de 
su conjetura, así como la confiabilidad de la conjetura del profesor? 


3.4 BASES ORTOGONALES Y GRAM-SCHMIDT 


En una base ortogonal, todos los vectores son perpendiculares entre sí. Los ejes de coorde¬ 
nadas son mutuamente ortogonales. Esta situación es casi óptima, y la única mejoría es fá¬ 
cil de realizar: cada vector se divide entre su longitud con la finalidad de hacerlo un vector 
unitario. Así se cambia una base ortogonal a una base ortonormál de qs: 



3F Los vectores <?,,. . . , q n son ortonormales si 

T J 0 siempre que ¡ yt j, proporcionando la ortogonalidad; 

q ‘ ~ 1 1 siempre que i = j, proporcionando la normalización. 

Una matriz con columnas ortonormales se denomina Q. 


El ejemplo más importante es la base estándar. Para el plano x-y, los ejes más cono¬ 
cidos e x = (1, 0) y <? 2 = (0, 1) no sólo son perpendiculares, sino que también son horizon¬ 
tal y vertical, respectivamente. Q es la matriz identidad de 2 por 2. En n dimensiones, la 
base estándar e x , ... ,e n nuevamente consta de las columnas de Q — I: 

’l] [o] fo" 

0 1 0 

«i=°, e 2 = 0 , ..., e n = 0 . 

oj [oJ L 1 . 

¡Esta no es la única base ortonormál! Es posible rotar los ejes sin modificar los ángulos rec¬ 
tos a los que se cortan. Estas matrices rotación constituyen ejemplos de Q. 

Si se tiene un subespacio de R", los vectores estándar e¡ pueden no estar en ese subes¬ 
pacio. Sin embargo, el subespacio siempre tiene una base ortonormál, que puede construir¬ 
se en forma sencilla a partir de cualquier base dada. Esta construcción, que transforma un 
conjunto sesgado de ejes en un conjunto perpendicular, se denomina ortogonalización de 
Gram-Schmidt. 

En resumen, los tres tópicos fundamentales de esta sección son: 


Base 

estándar 


1. La definición y las propiedades de las matrices ortogonales Q. 

2. La solución de Qx = b, ya sea de n por n o rectangular (mínimos cuadrados). 

3. El proceso de Gram-Schmidt y su interpretación como una nueva factorización A — QR. 


3.4 Bases ortogonales y Gram-Schmidt 


175 



Cuando el renglón i de Q T multiplica a la columna j de Q, el resultado es qjq¡ = 0. 
Sobre la diagonal, donde i — j, se tiene qjq¡ = 1. Esta es la normalización a vectores uni¬ 
tarios de longitud 1. 

Observe que Q T Q — / incluso si Q es rectangular. Pero entonces Q T es sólo una inver¬ 
sa izquierda. 


Ejemplo 1 


eos 6 —sem9 _ T _ _ cosP senfl 

sen© eos# ’ Q ~~ Q ~ — sen g eos 9 ' 


Q hace girar a todo vector un ángulo 9, y Q T lo hace girar de regreso un ángulo —9. Resul¬ 
ta evidente que las columnas son ortogonales, y son ortonormales porque sen 2 9 + eos 2 
9 = 1. La matriz g T es justo una matriz tan ortogonal como lo es Q. 

Ejemplo 2 Cualquier matriz permutación P es una matriz ortogonal. Ciertamente, las columnas son 
vectores unitarios y ortogonales, ya que el 1 aparece en un sitio distinto en cada columna: 
La traspuesta es la inversa. 


0 

1 

0' 

0 

0 

f 

Si P = 0 

0 

1 entonces P~ l 

= P r — 1 

0 

0 

1 

0 

0 

0 

1 

0 


Una P antidiagonal, con P l3 = P 2 i — P 31 = 1. lleva los ejes x-y-z en los ejes z-y-x: 
un sistema “derecho” en un sistema “izquierdo”. Por tanto, hubiera sido erróneo sugerir 
que cada Q ortogonal representa una rotación. También se permite una reflexión. 

P — [° o J refleja cada punto (x, y) en (y, x), su imagen especular a través de la recta a 
45°. Geométricamente, una Q ortogonal es el producto de una rotación y una reflexión. 

Queda por abordar una propiedad compartida por las rotaciones y las reflexiones, y de 
hecho, por cualquier matriz ortogonal. No es compartida por las proyecciones, que no son 
ortogonales y ni siquiera invertibles. Las proyecciones reducen la longitud de un vector, 
mientras que las matrices ortogonales poseen una propiedad que es la más importante y ca¬ 
racterística de todas: 


'Matriz ortonormál hubiera sido un mejor nombre, pero ya es demasiado tarde para cambiar. También, no hay una 
denominación aceptada para una matriz rectangular con columnas ortonormales. Seguimos escribiendo Q. pero 
no se denominará “matriz ortogonal" a menos que sea cuadrada. 
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3R La multiplicación por cualquier Q preserva las longitudes: 

Longitudes sin cambio || Qx\\ = ||.x¡| para todo vector x. (2) 
También preserva productos intemos y ángulos, ya que (Qx) r (Qy) = x 7 Q r Qy = 


La preservación de longitudes proviene directamente de Q T Q = /: 

II 2* II 2 = II* II 2 debido a que {Qx) J (Qx) = x 7 Q 7 Qx = x 7 x. (3) 

Cuando el espacio se gira o refleja, se preservan todos los productos intemos y las longi¬ 
tudes. 

A continuación se abordará el cálculo en que se utiliza la propiedad especial Q 7 = 
QT Si se tiene una base, entonces cualquier vector es una combinación de los vectores de 
la base. Esto es excepcionalmente simple para una base ortonormal, lo cual será un con¬ 
cepto clave detrás de las series de Fourier. El problema es encontrar los coeficientes de los 
vectores de la base : 



Para calcular x¡ hay un truco evidente. Ambos lados de la ecuación se multiplican por qj. 
En el miembro izquierdo está qjb. En el miembro derecho todos los términos desapare¬ 
cen (porque qjq¡ =0) excepto el primer término. Lo que queda es 

q[b = x¡qjq¡. 

Debido a que qjq i = 1, se ha encontrado que x¡ = qjb. De manera semejante, el segun¬ 
do coeficiente es x% — qjb; este término permanece cuando se multiplica por qj . Los otros 
términos desaparecen por la ortogonalidad. Cada pieza de b tiene una fórmula sencilla, y 
al recombinar las piezas se recupera b; 

Todo vector b es igual a (qjb)qi + (qjb)qz + * - * + (qjb)q„. (4) 

No puedo resistir escribir esta base ortonormal en una matriz cuadrada Q. La ecuación 
vectorial xyq-, + ■ ■ • +x n q n = b es idéntica a Qx — b. (Las columnas de Q multiplican a 
las componentes de x). Su solución es x — Q~ l b. Pero como Q~ l = Q 7 -aquí es donde en¬ 
tra la ortonormalidad— la solución también es x = Q T b: 



Las componentes de x son los productos internos qjb, como en la ecuación (4). 

La forma matricial también muestra lo que ocurre cuando las columnas no son orto- 
normales. Expresar b como una combinación xia } + • • • +x n a n es lo mismo que resolver 
Ax = b. Los vectores de la base se van en las columnas de A. En ese caso, se requiere A -1 , 
lo cual cuesta trabajo. En el caso ortonormal sólo se requiere Q r . 

Observación 1 La razón a T b/a T a ya apareció antes, cuando b se proyectó sobre una rec¬ 
ta. Aquí a es q u el denominador es 1 y la proyección es {qjb)q i. Por tanto, se tiene una 
nueva interpretación de la fórmula (4): Todo vector b es la suma de sus proyecciones uni¬ 
dimensionales sobre las rectas que pasan por las qs. 
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Debido a que estas proyecciones son ortogonales, el teorema de Pitágoras sigue siendo 
válido. El cuadrado de la hipotenusa sigue siendo la suma de los cuadrados de las compo¬ 
nentes: 

||£>|| 2 = ( qjb) 2 + {qjb) 2 + • • • +(qjb) 2 que es II2 T ¿I| 2 - (6) 


Observación 2 Debido a que Q r = Q~ l , también se tiene que 22 T = I- Cuando Q vie¬ 
ne antes que Q T , la multiplicación toma los productos internos de los renglones de Q. (Pa¬ 
ra Q t Q eran las columnas.) Ya que el resultado es nuevamente la matriz identidad, se llega 
a una conclusión sorprendente: Los renglones de una matriz cuadrada son ortonormales 
siempre que lo sean las columnas. Los renglones apuntan en direcciones completamente 
distintas a las de las columnas, y geométricamente no veo por qué están obligados a ser or¬ 


tonormales, pero lo son. 

Columnas ortonormales 
Renglones ortonormales 


'1/73 1/72 1/76' 

2 = 1/75 o -2/76 . 
.1/73 —1/72 1/76. 


Matrices rectangulares con columnas ortonormales 


Este capítulo es sobre Ax = b, cuando A no necesariamente es cuadrada. Para Qx - b aho¬ 
ra se admite la misma posibilidad: puede haber más renglones que columnas. Los n vecto¬ 
res ortonormales q¡ en las columnas de Q tienen m> n componentes. Así, 2 es tina matriz 
de m por n y no es de esperar poder resolver Qx — b de manera exacta. Se resuelve por mí¬ 
nimos cuadrados. 

Si hay justicia, las columnas ortonormales deben hacer más sencillo el problema. Fun¬ 
cionó para matrices cuadradas, y ahora funcionará para matrices rectangulares. La clave 
consiste en observar que se sigue teniendo 2 T 2 = L Así, 2 T sigue siendo la inversa iz¬ 
quierda de Q. 

Para mínim os cuadrados, esto es todo lo que se necesita. Las ecuaciones normales se 
presentaron al multiplicar A* = b por la matriz traspuesta, para obtener A 7 Ax = A l: b. 
Ahora las ecuaciones normales son Q T Qx = Q Y b. ¡Pero 2 T 2 es I a matriz identidad! En 
consecuencia, x — Q 7 b, ya sea que Q es cuadrada y si * es una solución exacta, o si 2 
es rectangular y se requieren mínimos cuadrados. 



3S Si las columnas de Q son 
facilita: 


b sistema rectangular sin solución para ca 

Q r b ecuación normal para el mejor x donde 
Q 7 b x¡ es qjb. 

Qx la proyección de b es ( qjb)q\ + • • • +(, 

2 Q T b la matriz proyección es P = QQ T - 


Las últimas fórmulas son como p — Ax y P — A(A T A) 1 A T . Cuando las columnas son 
ortonormales, la “matriz producto cruz” A T A se convierte en 2 T 2 = La parte difícil de 
los mínimos cuadrados desaparece cuando los vectores son ortonormales. Las proyeccio¬ 
nes sobre los ejes no se presentan por pares, y p es la suma p = (qjb)q¡ + • ■ • +(q n b)q n . 

Se recalca que estas proyecciones no reconstruyen b. En el caso cuadrado m = n sí lo 
hacían. En el caso rectangular m > n no lo hacen. Proporcionan la proyección p y no el 
vector original b, que es todo lo que puede esperarse cuando hay más ecuaciones que in¬ 
cógnitas, y las qs dejan de ser una base. La matriz proyección suele ser A(A A) A , 


i 
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y aquí se simplifica a 


P = Q(Q y QY x Q r obien, P = QQ T . 


Ejemplo 3 


Ejemplo 4 


Observe que Q r Q es la matriz identidad de n por n, mientras QQ r es una matriz proyec¬ 
ción P de m por m. Es la matriz identidad sobre las columnas de Q (P las deja solas). Pero 
QQ l es la matriz cero sobre el complemento ortogonal (el espacio nulo de Q r ). 

El siguiente caso es sencillo pero típico. Suponga que un punto b — (x, y, z) se proyecta so¬ 
bre el plano x-y. Su proyección es p = (x, y, 0), y esta es la suma de las proyecciones por 
separado sobre los ejes x y y: 


y {q[b)q¡ = 0 
0 


(q!b)q 2 


La matriz proyección global es 


p = q\qj + qtq¡ 


i o o 

0 10, y 

0 0 0 


Proyección sobre un plano = suma de las proyecciones sobre q l y q 2 ortonormales. 

Cuando el promedio de los tiempos de medición es cero, ajustar una recta conduce a co¬ 
lumnas ortogonales. Considere t¡ = -3, t 2 = 0, t 3 = 3. Luego, el intento de ajustar y = 
C + Dt produce tres ecuaciones en dos incógnitas: 


C + Dti = y i 
C + Dt 2 = y 2 , 
C + Dt 3 = y 3 


o bien, 


Las columnas (1, 1, 1) y (—3, 0, 3) son ortogonales. Es posible proyectar y por separado 
sobre cada columna, de modo que los mejores coeficientes C y D pueden encontrarse por 
separado: 


i i] [yi yt 

l 2 4* l 2 "f" ^2 


o 3] [yi y 2 y 3 ] 
(—3) 2 ó* O 2 -f- 3 2 


Observe que C = (yi + y 2 + y 3 )/ 3 es la media de los datos. C proporciona el mejor 
ajuste por una recta horizontal, mientras Dt es el mejor ajuste por una recta que pasa por 
el origen. Las columnas son ortogonales, de modo que la suma de estas dos piezas por se¬ 
parado constituye el mejor ajuste por cualquier recta. Las columnas no son vectores uni¬ 
tarios, por lo que C y D tienen la longitud al cuadrado en el denominador. 

Las columnas ortogonales son en mucho mejores, tanto que merece la pena cambiar a 

ese caso. Si el promedio de los tiempos de observación no es cero -es F = (t\ H-+ 

t m )/ m - entonces el origen del tiempo puede cambiarse por 7. En vez de y = C + Dt se 

trabaja con y — c + d[t — 7). ¡La mejor recta es la misma! Así como en el ejemplo, se en¬ 
cuentra 


0 ! i 7 3 * 
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~ = í 1 • • • !] [yi • • • ym] T = >! + '•■ +ym 

l 2 + l 2 + • • • -t-1 2 m 

2 = ••• (4. — 7)] [yi y m ] T = £(?¿ ~ J )y¡ 

(t¡ — t) 2 + ■■ ■ +(t m — t) 2 £(f, - 7) 2 ' 

El mejor c es la media, y también se obtiene una fórmula conveniente para d. Los elemen¬ 
tos fuera de la diagonal de la A T A anterior eran 2f¡, y al cambiar el tiempo por 7 estos ele¬ 
mentos se hacen cero. Este cambio es un ejemplo del proceso de Gram-Schmidt, que 
ortogonaliza la situación de antemano. 

Las matrices ortogonales son cruciales en álgebra lineal numérica, ya que no introdu¬ 
cen inestabilidad. Mientras las longitudes permanecen igual, el redondeo está bajo control. 
La ortogonalización de vectores se ha convertido en una técnica esencial. Quizá sólo esté 
en segundo lugar, detrás de la eliminación; y conduce a una factorización A = QR que es 
casi tan famosa como A = LU. 


El proceso de Gram-Schmidt 

Suponga que se tienen tres vectores independientes a, b, c. Si son ortonormales, las co¬ 
sas son fáciles. Para proyectar un vector v sobre el primero, se calcula (a T v)a. Para pro¬ 
yectar el mismo vector v sobre el plano de los dos primeros, simplemente se suma 
(a T v)a + (b T v)b. Para proyectar sobre lo generado por a, b, c, se suman tres proyeccio¬ 
nes. Todos los cálculos sólo requieren los productos internos a T v, b T v, y c' u. Pero para ha¬ 
cer realidad esto, es obligado decir: “Si son ortonormales.” A continuación se propone 
encontrar una manera de hacerlos ortonormales. 

El método es sencillo. Se tienen a,b,cy se buscan q x , q z , q 3 . Con q x no hay proble¬ 
ma: puede ir en la dirección de a. Se divide entre la longitud, de modo que qi = a! ||a|| es 
un vector unitario. El verdadero problema empieza con q 2 , que debe ser ortogonal a q x . Si 
el segundo vector b tiene cualquier componente en la dirección de q x (que es la dirección 
de a), es necesario restar esa componente: 

Segundo vector B—b~(qJb)q¡ y q 2 —B/\\B\\. (9) 

B es ortogonal a q¡. Es la parte de b que va en una nueva dirección, y no en la dirección de 
a. En la figura 3.10, B es perpendicular a q x . Establece la dirección para q 2 . 



Figura 3.10 La componente q x de b se elimina; ay B se normalizan en q x y q 2 . 

En este punto ya se cuenta con q x y q 2 . La tercera dirección ortogonal empieza con c. 
No está en el plano de q x y q 2 , que es el plano de ay b. No obstante, puede tener una com¬ 
ponente en ese plano, y ésta, debe restarse. (Si el resultado es C = 0, esto indica que a, b. 
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c no eran independientes desde el principio.) Lo que queda es la componente C que se bus¬ 
ca, la parte que está en una nueva dirección perpendicular al plano: 


Tercer vector 


C = c - (qjc)q t - (qjc)q 2 y q 3 = C/||C||. 


Esta es la idea de todo el proceso de Gram-Schmidt; restar de cada vector nuevo sus com¬ 
ponentes en las direcciones ya establecidas. Esta idea se utiliza una y otra vez.* Cuando se 
tiene un cuarto vector, se restan sus componentes en las direcciones de q x , q 2 , q 3 . 

Ejemplo 5 Gram-Schmidt Suponga que los vectores independientes son a, b, c: 

l] I" 1 ] I" 2 " 

a = 0 , b = 0 , c=l. 

-iJ L°j [o 

Para encontrar q x , el primer vector se hace unitario: a, — al V2. Para encontrar q 2 , del se¬ 
gundo vector se resta su componente en la primera dirección: 


B =b-(qjb) q¡ =0-4= 0 


El q 2 normalizado es B dividido entre su longitud, para producir un vector unitario: 


Para encontrar q 3 , de c se resta su componente a lo largo de q¡ y q 2 : 

C =c~ { qjc)q l - ( q]c)q 2 

'2l ri/V2l I" 1/V2] |0' 

= 1 -V2 0 -V2 0 = 1 . 

oj [ 1 /V 2 J L _1 /V 2 j [o 

Este vector ya es unitario, de modo que es q 3 . Acudí a longitudes desesperadas para dismi¬ 
nuir el número de raíces cuadradas (la parte penosa del proceso de Gram-Schmidt). El re¬ 
sultado es un conjunto de vectores ortonormales q u q 2 , q 3 , que van en las columnas de una 
matriz ortonormal Q: 



1 [1/V2 

1/V2 

0 ' 

Base ortonormal 

2 = ?1 «2 ?3 = 0 

0 

1 


J L1/V2 

-1/V2 

0 


*Si Gram fue el primero que tuvo esta idea, ¿qué le quedó a Schmidt? 



* ..— - - ' - n , -OttUUUAÍ 
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3T El proceso de Gram-Schmidt empieza con vectores independientes a,. a„ 

y termina con vectores ortonormales q x ,..., q n . En el paso j resta de a) sus compo¬ 
nentes en las direcciones q u .. ., q } ~¡ que ya están establecidas: 

Aj = a¡ - (qja j )q í - • • • -{qJ_ l a j )q J -¡. ( 11 ) 

Luego, qj es el vector unitario A ¡I || A¡ ||. 

Observación sobre los cálculos Considero que es más fácil calcular los ortogonales a , B, 
C, sin forzar a que sus longitudes sean iguales a 1. Luego, las raíces cuadradas entran sólo 
al final, cuando se divide entre esas longitudes. El ejemplo anterior debería tener las mis¬ 
mas B y C, sin utilizar raíces cuadradas. Observe el | de a r b/a r a en vez del ^5 de q T b: 



La factorización A = Qfí 

Se empezó con una matriz A, cuyas columnas eran a, b, c. Se termina con una matriz Q, 
cuyas columnas son q x ,q 2 ,q 3 . ¿Cuál es la relación entre estas matrices? Las matrices A y 
Q son de m por n cuando los n vectores están en el espacio m-dimensional, y debe haber 
una tercera matriz que las relacione. 

La idea es escribir las as como combinaciones de las qs. El vector b en la figura 3.10 
es una combinación de los q x y q 2 ortonormales, y se sabe de cuál combinación se trata: 

b = ( qjb)q\ + ( qjb)q 2 . 

Todo vector en el plano es la suma de sus componentes q¡ y q 2 . De manera semejante, c es 
la suma de sus componentes q u q 2 , q 3 : c = (qjc)q¡ + (qjc)q 2 + [q 3 c)q 3 - Si lo anterior 
se expresa en forma matricial, se tiene la nueva factorización A = QR : 

[qja qjb qjc 

1 qi 93 qjb q 2 c - QR (12) 

J L 13 c i 

¡Observe los ceros en la última matriz! R es triangular superior debido a la forma en que 
se realizó el proceso de Gram-Schmidt. Los primeros vectores ay q x están sobre la misma 
recta. Luego, q x y q 2 estaban en el mismo plano que a, b. Los terceros vectores, c y q 3 no 
se requirieron sino hasta el paso 3. 

La factorización QR es como A = LU, excepto que el primer factor Q tiene columnas 
ortonormales. El segundo factor se denomina R, porque los elementos diferentes de cero 
están a la derecha de la diagonal (y la letra U ya se había utilizado). Los elementos fuera 
de R fuera de la diagonal son los números qjb = 1/ -J2 y qjc = qjc — -J2 , que se en¬ 
contraron antes. Toda la factorización es 

'1 1 2] [1/V2 1/V2 0] [V2 1/V2 vT 

A = 0 0 1 = 0 0 1 1/V2 V2 = QR. 

1 0 oj [ 1 /V 2 - 1 /V 2 oj L 1 . 
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Las longitudes de a, B, C se observan en la diagonal de R. Los vectores ortonormales q u 
q 2 , c? 3 , que constituyen todo el objeto de la ortogonalización, están en el primer factor Q. 

Tal vez QR no es tan elegante como LU (debido a las raíces cuadradas). Ambas facto- 
rizaciones revisten una importancia crucial en la teoría del álgebra lineal, y absolutamente 
fundamental en los cálculos. Si LU es Hertz, entonces QR es Avis. 

Los elementos r¡¡ — qja¡ aparecen en la fórmula (11), cuando ||A ( ||^ se sustituye 
por Af. 

a i = ( qJ a j)qi + • ■ ■ + (q]-iaj)qj-i + \\A¡ \\q¡ = Q Multiplicado por la columna; de R (13) 

311 Toda matriz de m por n con columnas independientes puede factorizarse en 
A = QR. Las columnas de A son ortonormales, y R es triangular superior e inver- . 
tibie. Cuando m = n, y todas las matrices son cuadradas, Q se convierte en una ma¬ 
triz ortogonal.' , ' : . 

No debe olvidarse la cuestión más importante de la ortogonalización. Simplifica el 
problema de mínimos cuadrados a Ax = 6 . Las ecuaciones normales siguen siendo correc¬ 
tas, pero A t A se vuelve más fácil: 

A t A = R T Q r QR = R T R. (14) 

La ecuación fundamental A T A x = A r h se simplifica a un sistema triangular. 

R T Rx = R T Q r b o bien R2 = Q r b. (15) 

En vez de resolver QRx — b, lo cual no es posible, se resuelve Rx = Q T b, lo cual supo¬ 
ne sólo sustitución hacia atrás porque R es triangular. El costo real lo constituyen las mn 2 
operaciones del proceso de Gram-Schmidt, que son necesarias para encontrar en primer lu- 
gar a Q y a R. 

La misma idea de ortogonalidad se aplica a las funciones. Los senos y los cosenos son 
ortogonales; las potencias 1, x, x 2 no lo son. Cuando/(x) se escribe como una combinación 
de senos y cosenos, se trata de una serie de Fourier. Cada término es una proyección so¬ 
bre una recta; la recta en el espacio de funciones que contiene múltiplos de eos nx o de sen 
nx. Esta situación es completamente paralela al caso vectorial, y es muy importante. Por úl¬ 
timo, se tiene una tarea para Schmidt: ortogonalizar las potencias de x y producir los poli¬ 
nomios de Legendre. 

Espacios de funciones y series de Fourier 

Esta sección es breve y opcional, aunque tiene varias buenas intenciones: 

1. Introducir el espacio vectorial de dimensión infinita más famoso (el espacio de Hil- 
bert); 

2. Extender los conceptos de longitud y producto intemo de vectores v a funciones/(x); 

3. Identificar las series de Fourier como sumatorias de proyecciones unidimensionales 
(las “columnas” ortogonales son los senos y los cosenos); 

4. Aplicar el proceso de ortogonalización de Gram-Schmidt a los polinomios 1, x, x 2 ,...; y 

5. Encontrar la mejor aproximación a/(x) mediante una recta. 

Trataremos de seguir este esbozo, que abre una variedad de nuevas aplicaciones para 
el álgebra lineal de manera sistemática. 

1. Espado de Hilbert. Luego de estudiar R", resulta natural pensar en el espacio R°°. 
Contiene a todos los vectores v = (v¡, v 2 , u 3 ,.. .) con una sucesión infinita de componen¬ 
tes. En realidad, este espacio es demasiado grande cuando no hay control sobre el tamaño 
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de las componentes v¡. Una idea mucho mejor es preservar la conocida definición de lon¬ 
gitud, usando una suma de cuadrados, e incluir sólo aquellos vectores cuya longitud sea 
finita: 

Longitud al cuadrado ||u|| 2 = v 2 + v\ + v\ + ■ ■ ■ (16) 

La serie infinita debe converger a una suma finita. Esto deja (l, |, |,...) pero no (1, 1, 
1 ,...)• Los vectores con longitud finita pueden sumarse (||v + u>|| < ||u|| + || w ||) y mul¬ 
tiplicarse por escalares, de modo que forman un espacio vectorial. Es el célebre espacio de 
Hilbert. 

Este espacio es la forma natural para hacer que las dimensiones se vuelvan infinitas, y 
al mismo tiempo preservar la geometría del espacio euclidiano normal. Las elipses se con¬ 
vierten en elipsoides de dimensión infinita, y las rectas perpendiculares se reconocen exacta¬ 
mente como antes. Los vectores v y w son ortogonales cuando su producto intemo es cero: 

Ortogonalidad v T w = ViWi + v 2 w 2 + v-¡w-¡ + • ■ ■ =0. 

Se garantiza que esta sumatoria converge, y que para dos vectores cualesquiera sigue cum¬ 
pliendo la desigualdad de Schwarz |t> T u>| < ||u|| ||iü||. El coseno, incluso en el espacio de 
Hilbert, nunca es mayor que 1. 

Hay otra cuestión extraordinaria respecto a este espacio: se presenta bajo numerosos 
disfraces. Sus “vectores” pueden ser funciones, lo cual es otra cuestión importante. 

2. Longitud y productos internos. Suponga que/(x) = sen x sobre el intervalo 0 < x < 
277. Esta/es como un vector con todo un continuo de componentes, donde los valores de 
sen x están a lo largo de todo el intervalo. Para encontrar la longitud de un vector así, la re¬ 
gla de costumbre de sumar los cuadrados de las componentes se vuelve imposible. Esta su¬ 
matoria se sustituye, de forma natural e inevitable, por la integración-. 

J f2tc p2n 

(f(x)) 2 dx = / (senx) 2 dx = n. (17) 
o Jo 

El espacio de Hilbert se ha convertido en un espacio de funciones. Los vectores son fun¬ 
ciones, se cuenta con un método para medir su longitud, y el espacio contiene a todas aque¬ 
llas funciones de longitud finita, justo como en la ecuación (16). No contiene a las 
funciones F(x) = 1/x, ya que la integral de 1 he es infinita. 

La misma idea de sustituir la sumatoria por la integración produce el producto inter¬ 
no de dos funciones: Si/(x) = sen x y g(x) = eos x, entonces su producto interno es 

/ , 2tt 

f(x)g(x)dx= / sen x eos x dx = 0. (18) 

o Jo 

Esto es exactamente como el producto intemo vectorial f r g. Sigue estando relacionado con 
la longitud mediante (/, /) = ||/|| 2 . La desigualdad de Schwarz se sigue cumpliendo: 
| (/, g) | < || /1| || g ||. Por supuesto, dos funciones como sen x y eos x, cuyo producto inter¬ 
no es cero, se denominan ortogonales. Incluso, son ortogonales después de la división en¬ 
tre su longitud -/rt. 

3. La serie de Fourier de una función es un desarrollo en senos y cosenos: 

/(x) = a 0 + a% cosx + b\ senx + a 2 cos2x + b 2 sen2x 3- 

Para calcular un coeficiente como b¡. ambos miembros se multiplican por la función co¬ 
rrespondiente sen x y se integra desde 0 hasta 27r. (La función g(x) está dada en ese inter¬ 
valo). En otras palabras, se toma el producto intemo de ambos miembros con sen x: 
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f(x) senx dx 


sen x dx + a x / cosx senx dx + b x 


(sen x ) 2 dx + 


En el miembro derecho, cada integral es cero excepto una: donde sen x se multiplica a sí 
mismo. Los senos y los cosenos son mutuamente ortogonales , como en la ecuación (18): 
Por tanto b x es el miembro izquierdo dividido por aquella integral no cero: 


$ a f( x ) senx dx 
fg 7r (senx) 2 dx 


(/, sen*) 
(senx, senx) 


El coeficiente de Fourier a x hubiera podido ser eos x en vez de sen x, y a 2 hubiera podido 
ser eos 2x. 

Todo el asunto consiste en ver la analogía con las proyecciones. La componente del 
vector b a lo largo de la recta generada por a es b T a/a T a. Una serie de Fourier proyecta 
f{x) sobre sen x. Su componente p en esta dirección es exactamente b x sen x. 

El coeficiente h, es la solución por mínimos cuadrados de la ecuación inconsistente b¡ 
sen x = /(x). Esto lleva a b x sen x lo más cerca posible de/(x). Todos los términos en la 
serie son proyecciones sobre un seno o un coseno. Debido a que los senos y los cosenos 
son ortogonales, la serie de Fourier proporciona las coordenadas del “vector” /(x) respec¬ 
to a un conjunto de (una infinidad de) ejes perpendiculares. 

4. Gram-Schmidt para funciones. Además de los senos y los cosenos, hay muchas fun¬ 
ciones útiles que no siempre son ortogonales. Las más sencillas son las potencias de x, y 
lamentablemente no existe ningún intervalo sobre el cual incluso 1 y x 2 sean perpendicu¬ 
lares. (Su producto interno siempre es positivo, ya que es la integral de x 2 .) En consecuen¬ 
cia, la parábola más próxima a f(x ) no es la suma de sus proyecciones sobre 1, x, y x 2 . Hay 
una matriz como (A T A)~', y su correlato está dado por la matriz de Hilbert mal acondi¬ 
cionada. Sobre el intervalo OSrS 1, 


"(Ll) ( 1 ,*) ( 1 , x 2 ) 

A T A = (x, 1) (x, x) (x, x 2 ) 

(x 2 , 1 ) (x 2 , x) (x 2 , x 2 ) 


/1 fx f* 2 
fx fx 2 fx 3 

fx 2 fx 3 fx* 



"1 

1 

2 

l -| 
3 

— 

1 

2 

1 

3 

1 

4 


1 

1 

1 


-3 

4 

5-1 


Esta matriz tiene una gran inversa, ya que los ejes 1, x, x 2 están lejos de ser perpendicula¬ 
res. La situación se vuelve imposible si se agregan unos cuantos ejes más. Es virtualmen¬ 
te inútil resolver A T Ax = ÁJb para el polinomio más próximo de grado diez. 

Con más precisión, resulta inútil resolver esto por eliminación gaussiana; todo error 
por redondeo puede amplificarse por más de 10 13 . Por otra parte, no es posible rendirse y 
ya; la aproximación mediante polinomios debe ser posible. La idea correcta es cambiar a 
ejes ortogonales (con el proceso de Gram-Schmidt): Se buscan combinaciones de 1 , x, 
x 2 que sean ortogonales. 

Resulta conveniente trabajar con un intervalo situado simétricamente como — 1 < x 
^ L ya que así todas las potencias impares de x se hacen ortogonales a todas las potencias 
pares: 

( 1 , x) = f x dx = 0, (x, x 2 ) = f x 3 dx — 0 . 


En consecuencia, el proceso de Gram-Schmidt puede empezar aceptando a», = lyt ) 2 = 
x como los dos primeros ejes perpendiculares. Debido a que (x, x 2 ) = 0, sólo tiene los án¬ 
gulos correctos entre 1 y x 2 . El tercer polinomio ortogonal es 
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Ortogonalizar V3 = x 2 


( 1 , x 2 ) (x,x 2 ) 


f IjX 2 dx 
1 dx 


Los polinomios que se construyen de esta manera se denominan polinomios de Engendre 
y son ortogonales mutuamente sobre el intervalo —1 =£ x 1 . 


Comprobar 


i)- Lf 


Ahora ya es posible calcular el polinomio más próximo de grado 10, sin ningún desastre, 
al proyectar sobre los 10 (u 11) primeros polinomios de Legendre. 

5. Mejor recta. Suponga que se desea aproximar y = x 5 mediante una recta C + Dx en¬ 
tre x = 0 y x = 1. Hay por lo menos tres formas para encontrar esa recta, y si se comparan 
estas formas, entonces ¡todo el capítulo se aclara! 

1. Se resuelve [l x] [£] = x 5 por mínimos cuadrados. La ecuación A T Ax = A T b es 


(1,1) (L x) C (l,x 5 ) 1 ! [Cl i 

(x, 1) (x,x)J [jDJ [(x,X 3 )J |_2 3 J L^J 

Se minimiza E 2 = / 0 V - C - Dx) 2 dx = ± - \C - § D + C 2 + CD + 
\D 2 . Las derivadas respecto aCyC, después de dividir entre 2, traen de regreso las 
ecuaciones normales del método 1 (y la solución esC = |— -jj, D = |). 


jD + C 2 + CD 


\ +C + \d =0 
6 2 


1 1 1 
-- + -C + —D = 0. 
7 2 3 


Se aplica el proceso de Gram-Schmidt para sustituir x por x - (1, x)/(l, 1)- Esto es 
x — |, que es ortogonal a 1. Luego, las proyecciones unidimensionales producen la 
mejor recta: 


C + Dx 


x5 > D i + (* 5 < x ;) / _ ij _ I + £ ( x - 

(Ll) 1 (x-i,x-i) ( * 2) 6 ?V 2) 


Conjunto de problemas 3.4 

1. a ) Escriba las cuatro ecuaciones para ajustar y = C + Dt a los datos 


-4 en í = —2, y 
-1 en t — 1 , y 


-3 en t 


Demuestre que las columnas son ortogonales. 

b) Encuentre la recta óptima, trace su gráfica, y escriba E 2 . 

c ) Interprete el error cero en términos del sistema original de cuatro ecuaciones en dos 

incógnitas: el miembro derecho (—4, —3, —1, 0) está en el espacio-. 

Proyecte b = (0, 3, 0) sobre cada uno de los vectores ortogonales a x = (f, f, — 3 ) y 
a 2 — ( — 5 ' i‘ I)» Y luego encuentre su proyección p sobre el plano de a¡ y a 2 . 
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3. Encuentre también la proyección de b = (0, 3, 0) sobre a 3 = — f, §) y sume las 

tres proyecciones. ¿Por qué P = a ¡aJ + a 2 aj + a 3 a¡ es igual a P. 

4. Si Q¡ y O, son matrices ortogonales, de modo que Q T Q = I, demuestre que Q X Q 2 tam¬ 
bién es ortogonal. Si Q { es una rotación en un ángulo 9 y Q 2 es una rotación en un án¬ 
gulo 4 >, ¿a qué es igual <2102? ¿Puede encontrar las identidades trigonométricas para 
sen (9 + 4>) y eos {0 + cf>) en la multiplicación de matrices Q^Q^P- 

5. Si u es un vector unitario, demuestre que Q = I - 2uu l es una matriz ortogonal simé¬ 
trica. (Es una reflexión, también conocida como transformación de Householder.) Calcu¬ 
le Q cuando u T = [i \ -i -I]. 

6. Encuentre una tercera columna de modo que la matriz 

'I/a/3 1/vT4 

Q = 1A/3 2/Vl4 

MJ% -3/VT4 

sea ortogonal. Debe ser un vector unitario que sea ortogonal a las otras columnas; 
¿cuánta libertad deja esto? Compruebe que los renglones automáticamente se vuelven 
ortonormales al mismo tiempo. 

7. Demuestre, formando directamente h T b, que el teorema de Pitágoras se cumple para 

cualquier combinación b = x x q x H- +x„q n de vectores ortonormales: \\b\\ 2 = 

xf + ■ ■ ■ +x 2 .. En términos matriciales, b — Qx, de modo que esto demuestra otra vez 
que se preservan las longitudes: ||Qx|| 2 = ||x|| 2 . 

8. Proyecte el vector b = (1, 2) sobre dos vectores que no sean ortogonales, a x — (1, 0) 
ya 2 = (1, 1). Demuestre que, a diferencia del caso ortogonal, la suma de las dos pro¬ 
yecciones unidimensionales no es igual a b. 

9. Si los vectores q x ,q 2 , q 3 son ortonormales, ¿cuál combinación de q¡ y q 2 es la más pró¬ 
xima a qP 

10. Si q x y q 2 son la salida del proceso de Gram-Schmidt, ¿cuáles eran los posibles vecto¬ 
res de entrada ay bl 

11. Demuestre que una matriz ortogonal triangular superior debe ser diagonal. 

12. ¿Qué múltiplo de a i = [[] debe restarse a a 2 = [J] para que el resultado sea ortogo¬ 
nal a a,? Factorice |j ¡}] en QR con vectores ortonormales en Q. 

13. Aplique el proceso de Gram-Schmidt a 


y escriba el resultado en la forma A = QR. 


c — 1 

1 


14. A partir de los vectores no ortogonales a, b, c, encuentre vectores ortonomales q x , q 2 , 
‘ib 


3.4 Bases ortogonales y Gram-Schmidt 
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15. Encuentre un conjunto ortonormal q u q 2 , q 2 para el cual q x y q 2 generen el espacio co¬ 
lumna de 



¿Qué subespacio fundamental contiene a qP ¿Cuál es la solución por mínimos cua¬ 
drados de Ax = b si b = [l 2 7] T ? 

16. Exprese la ortogonalización de Gram-Schmidt de a 1( a 2 como A = QR: 



Dados n vectores a¡ con m componentes, ¿cuáles son las formas de A, Q, y RP. 

17. Con la misma matriz A del problema 16, y con b — [ 1 1 l] , use A = QR para 

resolver el problema de mínimos cuadrados Ax = b. 

18. Si A = QR, encuentre una fórmula sencilla para la matriz proyección P sobre el espa¬ 
cio columna de A. 

19. Demuestre que los siguientes pasos modificados del proceso de Gram-Schmidt produ¬ 
cen la misma C que en la ecuación (10): 

C* — c — (qjc)q¡ y C = C* - (q¡C*) q 2 . 

Esto es mucho más estable, restar las proyecciones una a la vez. 

20. En el espacio de Hilbert, encuentre la longitud del vector v = (1 /v2, 1/V4, 1/ 
V8,...) y la longitud de la función f(x) = er* (sobre el intervalo Osiá 1). ¿Cuál es 
el producto interno sobre este intervalo de e* y e~ x ? 

21. ¿Cuál es la función a eos x + b sen x más próxima a la función/(x) = sen 2x sobre 
el intervalo de -tt a 7r? ¿Cuál es la recta c + dx más próxima? 

22. Iguale la derivada a cero para encontrar el valor de b x que minimiza 

J /»2xr 

(bi senx — cosx) 2 dx. 
o 

Compare con el coeficiente b } de Fourier. 

23. Encuentre los coeficientes de Fourier a 0 , a u b x de la función escalón y(x), que es igual 
a 1 sobre el intervalo 0<r<iry0enel intervalo restante ir <x<2tt: 

_ (y, 1) _ (y, cosx) _ (y, senx) 

00 _ (1,1) ül (cosx,cosx) 1 (senx,senx)' 

24. Encuentre los cuatro polinomios de Legendre. Se trata de una cúbica x 3 + ax 2 + 
bx + c que es ortogonal a 1, x, y x 2 - | sobre el intervalo — 1 á x =s 1. 

25. ¿Cuál es la recta más próxima a la parábola y = x 2 sobre — 1 < x S 1? 

26. En la fórmula de Gram-Schmidt (10), compruebe que C es ortogonal a q x y q 2 . 
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27. Encuentre una base ortonormal del subespacio generado por a¡ = (1, — 1, 0, 0), a 2 = 

( 0 , 1 ,- 1 , 0 ), 03 = ( 0 , 0 , 1 ,- 1 ). 

28. Aplique el proceso de Gram-Schmidt a (1, —1, 0), (0, 1, —1) y (1, 0, —1) para encon¬ 
trar una base ortonormal sobre el plano + x 2 + x 3 — 0. ¿Cuál es la dimensión de 
este subespacio y cuántos vectores diferentes de cero provienen del proceso de Gram- 
Schmidt? 

29. (Recomendado) Encuentre vectores ortogonales A, B y C por Gram-Schmidt a partir 
de a , b, c: 

a = (1,-1,0,0) ¿>=(0 ,1, -1,0) c = (0, 0, 1, -1). 

A, B, C y a, b, c son bases para los vectores perpendiculares a d — (1, 1, 1, 1). 

30. Si A = QR, entonces A r A = R J R — _triangular multiplicada por_triangu¬ 

lar. El proceso de Gram-Schmidt sobre A corresponde a eliminación sobre A T A. 
Compare 



Para A T A, los pivotes son 2, §, j y los multiplicadores son y — |. 

a) Use estos multiplicadores sobre A para demostrar que la columna 1 de A y B = co¬ 
lumna 2 —| (columna 1) y C = columna 3—2 (columna 2) son ortogonales. 

b) Compruebe que ||columna 1|| 2 = 2, ||B|| 2 = |, y ||C|| 2 = |,usando los pivotes. 

31. ¿Falso o verdadero? (proporcione un ejemplo en cualquier caso): 

a) QT X es una matriz ortogonal cuando Q es una matriz ortogonal. 

b) Si Q (de 3 por 2) tiene columnas ortonomales, entonces \\Qx\\ siempre es igual a |[x||. 

32. a ) Encuentre una base para el subespacio S en R 4 generado por todas las soluciones de 

x¡ + x 2 + x-} — Xa, = 0. 

ti) Encuentre una base para el complemento ortogonal S x . 

c) Encuentre b x en S y b 2 en S x de modo que b, + b 2 = b = (1, 1, 1, 1). 


3.5 LA TRANSFORMADA DISCRETA DE F0URIER 

La serie de Fourier es álgebra lineal en dimensiones infinitas. Los “vectores” son funcio¬ 
nes/ (x); éstas son proyectadas sobre los senos y los cosenos. Así se obtienen los coeficien¬ 
tes de Fourier a k y b k . A partir de esta serie infinita de senos y cosenos, multiplicados por 
a k y b k , es posible reconstruir a f(x). Este es el caso clásico, en el que soñaba Fourier, aun¬ 
que en los cálculos verdaderos lo que se calcula es la transformada discreta de Fourier 
(TDF). Fourier sigue vivo, pero en dimensiones finitas. 

Aquí se trata de álgebra lineal pura, basada en la ortogonalidad. La entrada es una su¬ 
cesión de números y 0 ,..., y n -¡, en vez de una función/(x). La salida c 0 ,... , c„_, tiene 
la misma longitud n. La relación entre y y c es lineal, de modo que debe estar dada por una 
matriz. Esta es la matriz F de Fourier, y toda la tecnología del procesamiento de señales 
digitales depende de ella. La matriz de Fourier posee propiedades extraordinarias. 
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Las señales se digitalizan, ya sea que provengan del habla, de imágenes, del sonar o 
de TV (o incluso de la exploración petrolera). Las señales son transformadas por la matriz 
F, y después es posible transformarlas nuevamente con la finalidad de reconstruirlas. Lo 
crucialmente importante es que FyF" 1 pueden ser rápidas: 

F -1 debe ser sencilla. Las multiplicaciones por Fy F _1 deben ser rápidas. 

Estas dos afirmaciones son ciertas. F~ 1 se ha conocido durante años, y se ve justo co¬ 
mo F. De hecho, F es simétrica y ortogonal (excepto por un factor -fñ), y sólo tiene un in¬ 
conveniente: sus elementos son números complejos. Este es un precio bajo que hay que 
pagar, lo cual se hace a continuación. Las dificultades son minimizadas por el hecho de que 
todos los elementos de F y F ~ 1 son potencias de un solo número w. Este número cumple 
w n = 1 . 

La transformada discreta de Fourier usa w = i (y observe que i 4 = l^El éxito de to¬ 
da la TDF depende de la multiplicación de F por su conjugado complejo F: 


lili 
1 i i 2 / 3 
1 i 2 i 4 i 6 
1 i 3 i 6 i 9 


"11 1 1 
1 (-i) (-i) 2 (-i) 3 

1 (-i) 2 (-i) 4 (~i) 6 

1 (~¡) 3 (- i ) 6 (- i ) 9 


De inmediato, FF = 41 indica que F~ 1 = F/4. Las columnas de F son ortogonales (pa¬ 
ra obtener los elementos cero en 41). Las matrices de n por n cumplen FF - ni. Así, la 
inversa de Fes justo F/ n. Dentro de poco se considerará el número complejo w = e 2nUn 
(que es igual a i para n = 4). 

Es extraordinario que F sea tan fácil de invertir. Si esto fuese todo (y hasta 1965 era 
todo), entonces la transformada discreta tendría un lugar importante. Ahora hay más. Las 
multiplicaciones por F y F ~ 1 pueden hacerse de una manera extremadamente rápida e in¬ 
geniosa. En vez de realizar n 2 multiplicaciones por separado, que provienen de los n 2 ele¬ 
mentos de la matriz, para efectuar los productos matrices-vectores Fe y F~~ x y, sólo se 
requieren 5 n log n pasos. Este reordenamiento de la multiplicación se denomina transfor¬ 
mada rápida de Fourier (TRF). 

Esta sección empieza con w y sus propiedades, continúa con F~\ y termina con la 
TRF: la transformada rápida. La gran aplicación en el procesamiento de señales es la fil¬ 
tración, y la clave de su éxito es la regla de convolución. En lenguaje matricial, todas las 
“matrices circulantes” son diagonalizadas por F. Así, se reducen a dos TRFs y una matriz 
diagonal. 


Raíces complejas de la unidad 

Es posible que ecuaciones reales tengan soluciones complejas. La ecuación x 2 + 1 = 0 
condujo a la invención de i (¡y también de -i!) Lo anterior fue declarado como una solu¬ 
ción y se cerró el caso. Si alguien preguntaba sobre x 2 — i = 0, había una respuesta: las raí¬ 
ces cuadradas de un número complejo de nuevo son números complejos. Es necesario 
permitir las combinaciones x + iy, con una parte real x y una parte imaginaria y, pero ya 
no se requieren inventos adicionales. Todo polinomio real o complejo de grado n tiene un 
conjunto completo de n raíces (tal vez complejas y tal vez repetidas). Este es el teorema 
fundamental del álgebra. 

Aquí se tiene interés en ecuaciones como x 4 = 1. Ésta tiene cuatro soluciones: las raí¬ 
ces cuartas de la unidad. Las dos raíces cuadradas de la unidad son 1 y — 1. Las raíces cuar¬ 
tas son las raíces cuadradas de las raíces cuadradas, 1 y i y -i. El número i satisface 
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i 4 = 1 porque satisface i 2 — — 1. Para calcular las raíces octavas de la unidad se requieren 
las raíces cuadradas de i, lo cual lleva a w = (1 + i)/ -Jl. Al elevar al cuadrado w se ob¬ 
tiene (1 +2/4- i 2 )/ 2, que es i porque 1 + i 2 es cero. Así, tu 8 = i 4 = 1. Aquí debe haber un 
sistema. 

Los números complejos eos 9 + i sen 6 en la matriz de Fourier son extremadamente 
especiales. La parte real se traza sobre el eje x y la parte imaginaria, sobre el eje y (véase 
la figura 3.11). Así, el número w está sobre la circunferencia unitaria ; su distancia al ori¬ 
gen es eos 2 6 + sen 2 6=1. Forma un ángulo 9 con la horizontal. Todo el plano se estudia 
en el capítulo 5, donde los números complejos aparecen como valores característicos (in¬ 
cluso de matrices reales). Aquí sólo se requieren puntos especiales w, todos ellos sobre la 
circunferencia unitaria, para resolver w n = 1. 



Figura 3.11 Las ocho soluciones de z s = 1 son 1, w, w 2 . w 7 con w = (1 + i)/ *J2.. 

El cuadrado de w puede encontrarse directamente (simplemente duplica el ángulo): 
tu 2 = (eos 6 + i sen 9) 2 = eos 2 6 - sen 2 9 + 2 i sen 6 eos 6. 

La parte real de eos 2 6 - sen 2 6 es eos 29, y la parte imaginaria 2 sen 6 eos 9 es sen 26». (Ob¬ 
serve que no se ha incluido a i; la parte imaginaria es un número real). Por tanto, w 2 = eos 
29 + i sen 26. El cuadrado de w sigue estando en la circunferencia unitaria, pero al ángulo 
doble 29. Esto hace sospechar que w" está en el ángulo n9, y la sospecha es correcta. 

Hay una mejor manera de tomar potencias de w. La combinación del coseno y el se¬ 
no es una exponencial compleja, con amplitud 1 y ángulo de fase 6: 

. eos 0 + i sen 6 = e w (2) 

Las reglas para multiplicar, como (e 2 )(e 3 ) = e 5 , se siguen cumpliendo cuando los exponen¬ 
tes i9 son imaginarios. Las potencias de w = e m permanecen en la circunferencia unita¬ 
ria'. 

Potencias de w tu 2 = e i2ti , .■ - . :nB , — = e~ w . (3) 

y- a 

La n-ésima potencia está al ángulo n9. Cuando n = -1, el ángulo del recíproco 1/w es -9. 
Si eos 9 + i sen 9 se multiplica por cos(-6>) + i sea(-9), se obtiene la respuesta 1: 

e‘ e e ,e — (eos 9 + i sen0)(cos0 — i sen 9) = eos 2 9 + sen 2 9 = 1. 
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Nota Recuerdo el día en que al MIT llegó una carta enviada por un prisionero en Nueva 
York, preguntando si la fórmula de Euler (2) era cierta. Es verdaderamente sorprendente 
que tres de las funciones clave en matemáticas se presenten juntas de forma tan elegante. 
Nuestra mejor respuesta fue considerar la serie de potencias de la exponencial: 


1 +i9 + 


{id) 2 (i 9 ) 3 + . 

2! 3! 


La parte real i — 9 2 / 2 + • • • es eos 9. La parte imaginaria 9 — 9 3 /6 + • • ■ es el seno. La 
fórmula es correcta, y me hubiera gustado enviar una demostración más hermosa. 

Con esta fórmula es posible resolver w n = 1. Esto se convierte en e !nl} = 1, de modo 
que n9 debe llevamos alrededor de la circunferencia unitaria y volver al principio. La so¬ 
lución es escoger 9 = 2nl n : la n-ésima raíz “ primitiva” de la unidad es 

w„ = e 2ni/ " = eos — + .t sen —. (4) 

n n 

Su n-ésima potencia es e 2lti , que es igual a 1. Para n = 8, esta raíz es (1 + i)/V 2 : 


71 n 

u) 4 = eos — + i sen — = i 
2 2 


7t 7t 

eos — + i sen — 
4 4 


La raíz cuarta está en 9 = 90°, que es \ (360°). Las otras raíces cuartas son las potencias 
i 2 — — 1, i 3 = —i, e i 4 = 1. Las otras raíces octavas son las potencias w\, i u\, ..., tu 8 . Las 
raíces son equidistantes sobre la circunferencia unitaria, a intervalos de 2 ir/n. Observe nue¬ 
vamente que el cuadrado de uig es i¿t 4 , lo cual es esencial en la transformada de Fourier rá¬ 
pida. La suma de las raíces es cero. Primero 1 + i — 1 — ¡’ — 0, y luego 

Suma de las raíces octavas 1 + wg + wj + • • • +w¡ = 0. (5) 

Una demostración es multiplicar el miembro izquierdo por w s , que lo deja sin cambio. (Se 
obtiene w s + w\ + • • • + w|, y tu|, es igual a 1). Cada uno de los ocho puntos se des¬ 
plaza un ángulo de 45°, aunque siguen siendo los mismos ocho puntos. Debido a que cuan¬ 
do se multiplica por w 8 el único número que permanece sin cambio es el cero, la suma debe 
ser cero. Cuando n es par, las raíces se cancelan por pares (como 1 + i 2 = 0 e i + i 3 = 0). 
Sin embargo, la suma de las tres raíces cúbicas de 1 también es igual a cero. 


La matriz de Fourier y su inversa 

En el caso continuo, la serie de Fourier puede reproducir a f(x) sobre todo un intervalo. Uti¬ 
liza una infinidad de senos y cosenos (o exponenciales). En el caso discreto, con sólo n coe¬ 
ficientes c 0 ,..., c„-i a elegir, sólo se pide igualdad en n puntos. Así se obtienen n 
ecuaciones. Se reproducen los cuatro valores y = 2, 4, 6, 8 cuando Fe = y: 

Cq + Cl + C2 + C 3 = 2 

Fc = Co + + ¿2c2 + ¿3c3 = 4 (6) 

Co + Í 2 C\ + Í 4 Co + í’ 6 C3 — 6 

Cq + ¿ 3 C( + Í 6 C2 + Í 9 C¡ = 8. 

La secuencia de entrada es y = 2, 4, 6, 8. La secuencia de salida es c 0 , c¡, c 2 , c 3 . Las cua¬ 
tro ecuaciones (6) buscan una serie de Fourier de cuatro términos que corresponda a las en¬ 
tradas en cuatro puntos equidistantes x sobre el intervalo de 0 a 2rr. 
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Serie de 
Fourier 
discreta 


Éstas son las cuatro ecuaciones en el sistema (6). En x — 27r, la serie devuelve y 0 = 2 j 
continúa periódicamente. La serie de Fourier discreta se escribe mejor en su forma comple¬ 
ja, como una combinación de exponenciales e ikx , en vez de como sen le t y eos fcc. 

Para toda n, la matriz que relaciona y con c puede invertirse. Representa n ecuaciones, 
lo cual requiere que la serie finita c 0 + c x e ix -i - (n términos) coincida con y (en n pun¬ 

tos). La primera coincidencia es en je = 0, donde c 0 + ■ • • + c n - x = y 0 . Los puntos res¬ 
tantes conllevan potencias de w, y el problema completo es Fe = y: 


Ahí queda la matriz F de Fourier con elementos F jk = w jk . Resulta natural numerar los 
renglones y las columnas desde 0 hasta n - 1, en vez de hacerlo desde 1 hasta n. El primer 
renglón tiene y = 0, la primera columna tiene k = 0, y todos los elementos son w° = 1. 

Para encontrar las es es necesario invertir F. En el caso de 4 por 4, F~ 1 se construyó 
a partir de l/¿ = —i. Esta es la regla general, que F _1 proviene del número complejo 
w~ l = w. Está en el ángulo -l-rr/n, donde w estaba en el ángulo +2 rin: 


La multiplicación del renglón y de F por la colu mn a j de F -1 siempre es (1 + 1 + • - • + 
1 lln = 1. La parte más difícil es fuera de la diagonal, demostrar que el renglón y de F mul¬ 
tiplicado por la columna & de F~‘ es cero: 

1 • 1 + w J w~ k + w 2 ^ w~ 2k •+••••+ w (. n ~Vj w -<,n-W — o s j j jt k. (9) 

La clave es observar que estos términos son las potencias de W = w J w~ k : 


El número W sigue siendo una raíz de la unidad: W" = w nJ w~ nk es igual a F1 = 1. Ya 
que y es distinto de k, W es diferente de 1. Es una de las otras raíces sobre la circunferen¬ 
cia unitaria. 


"1 

1 

i 

, i 
tiene F = — 

ri 

1 

1 

1 
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Estas raíces satisfacen \ + W +— Otra demostración proviene de 

1 _ w n = (1 - W)( 1 + W + W 1 + • • • +W n ~~ l ). (11) 

Debido a que W" = 1, el miembro izquierdo es cero. Pero W no es 1, por lo que el último 
factor debe ser cero. Las columnas de F son ortogonales. 

La transformada rápida de Fourier (TRF) 

El análisis de Fourier constituye una hermosa teoría, además de ser bastante práctico. Ana¬ 
lizar una forma de onda en sus frecuencias es la mejor manera de aislar una señal. El pro¬ 
ceso inverso regresa la señal. Por razones físicas y matemáticas, las exponenciales son 
especiales, y es posible precisar una razón central: Si e ikx se diferencia, se integra, o si x 
se traslada a x + h, el resultado sigue siendo un múltiplo de e ikx . Las exponenciales se 
ajustan especialmente a ecuaciones diferenciales, a ecuaciones integrales, y a ecuaciones 
en diferencias. Cada componente de la frecuencia va a su manera, como vector caracterís¬ 
tico, y se recombinan en la solución. El análisis y la síntesis de señales -calculando c a par¬ 
tir de y y y a partir de c— constituyen una parte toral del cálculo científico. 

Se quiere demostrar que Fe y F~‘y pueden efectuarse rápidamente. La clave está en 
la relación de F 4 con F 2 , o mejor aún, con dos copias de F 2 , que van en la matriz F 2 : 

lili] f 1 1 

1 i i 2 i 3 , , . _* 1—1 

, -2 ¿4 ¿6 esta próximo a F 2 = , , 

1 í 3 i 6 ¿ 9 J [ 1-1 

F 4 contiene las potencias de w 4 = i, la raíz cuarta de 1. F 2 * contiene las potencias de w 2 = 
— 1 , la raíz cuadrada de 1 . Observe especialmente que la mitad de los elementos en Ff . La 
transformada de 2 por 2, aplicada dos veces, sólo requiere la mitad de trabajo que una trans¬ 
formada directa de 4 por 4. Si una transformada de 64 por 64 puede sustituirse por dos 
transformadas de 32 por 32, entonces el trabajo se reduce a la mitad (más el costo de vol¬ 
ver a ensamblar los resultados). Lo que hace realidad, y posible en la práctica, lo anterior, 
es la simple relación entre vj (a y w 32 - 

(w M ) = u> 32 . O bien (e ) - e 

La trigésimosegunda raíz está dos veces más lejos en la circunferencia unitaria que la se- 
xagésimacuarta raíz. Si w 64 = 1, entonces (w 2 ) 32 = 1. La m-ésima raíz es el cuadrado de 
la n-ésima raíz, si m es la mitad de n: 

i v 2 = w m si m = | n- (12) 

La rapidez de la TRF, en la forma estándar aquí presentada, depende de trabajar con 
números altamente compuestos como 2 10 = 1024. Sin la transformada rápida, se requie¬ 
ren (1024) 2 multiplicaciones para obtener F por c (lo cual se desea a menudo). En contras¬ 
te, una transformada rápida puede realizar cada multiplicación en sólo 5 • 1024 pasos. £s 
200 veces más rápida, ya que sustituye un factor de 1024 por 5. En general, sustituye n 
multiplicaciones por \nl , cuando n es 2*. Al relacionar F n con dos copias de F„ /2 , y luego 
con cuatro copias de F^, y finalmente con una F muy pequeña, los n~ pasos de costumbre 
se reducen a | n log 2 n. 

Es necesario ver cómo y = F n c (un vector con n componentes) puede recuperarse a 
partir de dos vectores que sólo miden la mitad de largo. El primer paso es dividir c entre 
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sí mismo, separando sus componentes con número par de sus componentes con número 
impar: 

c' = (co, C 2 ,. . . , C n - 2 ) y c" = (c t ,C 3 ,..., C n - 1). 

Los coeficientes simplemente van de forma alterna en c' y c". A partir de estos vectores, la 
transformada a la mitad de tamaño proporciona y' = F m c' y y" = F m c". Estas son las dos 
multiplicaciones por la matriz más pequeña F m . El problema central consiste en recuperar 
y a partir de los vectores y' y y" que miden la mitad, Cooley y Tukey se dieron cuenta de 
cómo hacerlo: 

3W Las m primeras y las m últimas componentes del vector y = F n c son ' . 

yj = y'j +w J n y¡, j =0,..., m - 1 


yj+m = y'¡ - w J n y'j> 


0. m — 1. 


Por la "ío ios tres pasos son: separar c en c’ y c"; transformarlos por medio de F m en 
y’ y y"; y reconstruir y a partir de la ecuación (13). 

En un momento se comprobará que haciendo lo anterior se obtiene la y correcta. (Qui¬ 
zá el lector prefiera un diagrama de flujo al álgebra). Esta idea puede repetirse. Se va de 
^1024 a Fsi 2 a F-xsé- La cuenta final es \ni, cuando se empieza con la potencia n = 2 l y 
todo el camino la dirección es hacia n = 1, donde no se requiere multiplicación. Este nú¬ 
mero \nl, satisface la regla antes proporcionada: el doble del conteo para m, más m mul¬ 
tiplicaciones extra, producen el conteo para n: 

2 ^-m(£ — 1)^ + m = i ni. 

Otra forma de contar: De n = 2 e a n — 1 hay i pasos. Cada paso requiere n/2 multiplica¬ 
ciones por en la ecuación (13), que en realidad es una factorización de F„: 


Un paso de 
ia TRF 


F I 024 ~ 


i permutación 
[ par-impar 


El costo es sólo ligeramente más que lineal. El análisis de Fourier ha sido transforma¬ 
do completamente por la TFR. Para comprobar la ecuación (13), es necesario separar y¡ en 
par e impar. 




es idéntica a ^ cjk + w< n ‘ 


Cada sumatoria de la derecha consta de m = \ n términos. Debido a que w \ es w m , las dos 
sumatorias son: 

m — l m-l 

y ¡ = J2 w m c 'k + w i w % c * = y'j + "• ( 15 > 


Para la segunda parte de la ecuación (13), y + m en vez de j produce un cambio de signo: 
Dentro de las sumatorias, w k J; j+m) permanece debido a que w k ™ = 1* = 1. 
Fuera iu¿ +m = —w J n yaque w™ = e 2lr,m/ " = e ni = —1. 

La idea de la TRF se modifica fácilmente con la finalidad de permitir otros factores primos 
de n (no sólo potencias de 2). Si n mismo es primo, se aplica un algoritmo completamente 
distinto. 
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Ejemplo 1 Los pasos de« = 4am = 2 son 



Combinados, los tres pasos multiplican c por F 4 para obtener y. Debido a que cada paso es 
lineal, debe provenir de una matriz, y el producto de estas matrices debe ser F 4 : 



(16) 

Las dos copias de F 2 se reconocen en el centro. A la derecha se encuentra la matriz permu¬ 
tación que separa cenc'y c". A la izquierda está la matriz que multiplica por u>{. Si se hu¬ 
biera empezado con F s , la matriz de en medio hubiera contenido dos copias de F 4 . Cada 
una de éstas se hubiera separado como se hizo arriba. Entonces, ¡la TRF representa una 
factorización gigante de la matriz de Fourier! La simple matriz con nr no ceros es un pro¬ 
ducto de aproximadamente l = log 2 n matrices (y una permutación) con un total de sólo 
ni no ceros. 


La TRF y la mariposa 

El primer paso de la TRF cambia la multiplicación por F n en dos multiplicaciones por F 
Las componentes con número par (c 0 , c 2 ) se transforman por separado de (c¡, c 3 ). En la fi¬ 
gura 3.12 se proporciona un diagrama de flujo para n — 4. 



II 

i 

1 


i 


Para n = 8, la idea clave es sustituir cada recuadro F 4 por recuadros F 2 . El nuevo factor 
u» 4 = i es el cuadrado del factor anterior w — u>g = e llt,n ■ El diagrama de flujo muestra 
el orden en que las es entran en la TRF y las log 2 n etapas que les lleva entrar, y también 
muestra la sencillez de la lógica. 
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Cada etapa requiere \n multiplicaciones, de modo que el conteo final es \n log n. Hay 
una regla asombrosa para la permutación global de es antes de entrar en la TRF: Escribir 
los subíndices 0, . . . , 7 en binario e invertir el orden de sus bits. Los subíndices aparecen 
en “orden invertido de bits” en la parte izquierda de la gráfica. Los números pares apare¬ 
cen antes que los impares (los números que terminan con 0 aparecen primero que los nú¬ 
meros que terminan con 1). 

if Conjunto de problemas 3,5 

1. ¿Qué son F 2 y F 4 para la matriz F de Fourier de 4 por 4? 

2. Encuentre una permutación P de las columnas de F que produzca FP = ~F (de n por 
n). Combine lo anterior con FF = ni con la finalidad de encontrar F 2 y F 4 para la 

matriz F de Fourier de n por n. 

3. Si se forma una submatriz de 3 por 3 de la matriz F 6 de 6 por 6, manteniendo sólo los 
elementos que están en sus renglones y columnas, primero(a), tercero(a) y cuarto(a), 
¿cuál es esa submatriz? 

4. Indique todas las raíces sextas de 1 en el plano complejo. ¿Cuál es la raíz primitiva 
w 6 ? (Encuentre sus partes real e imaginaria). ¿Qué potencia de w 6 es igual a l/tü 6 ? 
¿Cuál es I + v> + w 2 + w 3 + j n 4 + w 5 ? 

5. Encuentre todas las soluciones de la ecuación e‘* = —1, y todas las soluciones de 
e w = i. 

6. ¿Cuáles son el cuadrado y la raíz cuadrada de w l2S , la centésimovigesimaoctava raíz 
primitiva de 1? 

7. Resuelva el sistema (6) de 4 por 4 si los miembros derechos son y 0 = 2, y, = 0, y 2 = 
2, y 3 = 0. En otras palabras, resuelva F 4 c = y. 

8. Resuelva el mismo sistema con y = (2, 0, -2, 0) sabiendo que Ff 1 y calculando 
c = F 4 -1 . Compruebe que c 0 + C\e ix +c 2 e 2ix + c 3 e yix asume los valores 2, 0, -2, 0 
en los puntos x = 0, ?r/2, jr, 3 jt/2. 

9. a) Si y = (1, 1, 1, 1), demuestre que c = (1, 0, 0, 0) satisface F 4 c = y. 
b) Ahora suponga que y = (1, 0, 0, 0), y encuentre c. 

10. Para n — 2, escriba y 0 a partir de la primera línea de la ecuación (13) y y] a partir de la 
segunda línea. Para n = 4, use la primera línea para encontrar y 0 y y l y la segunda 
línea para encontrar y 2 y y 3 , todo en términos de y' y y". 

11. Calcule y = F 4 c mediante los tres pasos de la transformada rápida de Fourier si c = 
(1, 0, 1, 0). Repita el cálculo con c = (0,1,0,1,0,1,0,1). 

12. Calcule y = F s c mediante los tres pasos de la transformada rápida de Fourier si c = 
(1, 0, 1, 0, 1, 0, 1, 0). Repita el cálculo con c = (0, 1, 0, 1, 0, 1, 0, 1). 

13. Para la matriz de 4 por 4, escriba las fórmulas para c 0 , Cj, c 2 , c 3 y compruebe que sif 
es impar, entonces c es impar. El vector/es impar si/„_ y - = para n = 4 esto sig¬ 
nifica/) = 0,/ 3 = —fxji — 0 como en sen 0, sen 7r/2, sen ir, sen 3ir/2. Esto es co¬ 
piado por c y conduce a una transformación rápida del seno. 

14. Multiplique las tres matrices en la ecuación (16) y compare con F. ¿En cuáles seis ele¬ 
mentos es necesario saber que i 2 = — 1 ? 
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15. Invierta los tres factores en la ecuación (14) para encontrar una factorización rápida de 
F~\ 

16. F es simétrica. Así, ¡trasponga la ecuación (14) para encontrar una nueva transforma¬ 
da rápida de Fourier! 

17. Todos los elementos en la factorización de F 6 implican potencias de w = raíz sexta de 1: 

F 6 = V D ~\ f^ 3 1 [ P 

U ~ D \ L f 3 J L J 

Escriba estos factores con 1, w, w 2 en D y 1, w 2 , w 4 en F 3 . ¡Multiplique! 

En los problemas 18 a 20 se introducen los conceptos de vector característico y valor 
característico, cuando el producto de una matriz multiplicada por un vector es un 
múltiplo de ese vector. Éste es el tema del capítulo 5. 

18. Las columnas de la matriz de Fourier F son los valores característicos de la permuta¬ 
ción cíclica P. Multiplique FF para encontrar los valores característicos X 0 a /. 3 : 


0 

1 

0 

0 


0 

0 

1 

0 


0 

0 

0 

1 


1 

0 

0 

0 



[i o o ÜJ n f r f j [i F F r J L a 3 j 

Ésta es FF = FA , o F = FAF~ l . 

19. Dos vectores característicos de esta matriz circulante c son (1, 1, 1, 1) y (1, i, i 2 , ¿ 3 ). 
¿Cuáles son los valores característicos e 0 y e{! 


Co 

Cl 

C2 

Cl 

C3 

Co 

Cl 

Cl 

C2 

C3 

Co 

Cl 

c 1 

c 2 

C3 

Co 


20. Encuentre los valores característicos de la matriz “periódica” C -1, 2, -1. Los Is en 
las esquinas de C la hacen periódica (una matriz circulante): 


tiene c<> 


-1, c 2 = 0, c 3 


21. Para multiplicar C por x, cuando C = FEF ', es posible multiplicar F(£(F x)). En 
el producto directo Cx se requieren n 2 multiplicaciones por separado. Si se conocen E 
y F, con el segundo método sólo se usan n log 2 n + n multiplicaciones. ¿Cuántas de 
éstas provienen de F, y cuántas de F ' ? 

22. ¿Cómo podría calcular rápidamente estas cuatro componentes de Fe empezando con 
c 0 + c 2 , c 0 ~ c 2 , ci + c 3 , Ci - c 3 ? ¡Está encontrando la transformada rápida de Fou- 


Co + ¡Cl + i 2 c 2 + ¿ 3 C 3 
Cq + i 2 c 1 + i 4 c 2 + i s c 3 
Co + X 3 Ci + i 6 c 2 + í 9 c 3 _ 
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Ejercicios de repaso 


3.1 Encuentre la longitud de a = (2, —2, 1), y escriba dos vectores independientes que 
sean perpendiculares a a. 

3.2 Encuentre todos ios vectores que sean perpendiculares a (1, 3, 1) y (2, 7, 2), hacien¬ 
do a éstos los renglones de A y resolviendo Ax = 0. 

3.3 ¿Cuál es el ángulo entre a = (2, —2, 1) y b — (1, 2, 2)? 

3.4 ¿Cuál es la proyección p de b = (1, 2, 2) sobre a — (2, —2, 1)? 

3.5 Encuentre el coseno del ángulo entre los vectores (3, 4) y (4, 3). 

3.6 ¿Dónde está la proyección de b = (1, 1, 1) sobre el plano generado por (1, 0, 0) y 
(1, 1, 0)? 

3.7 El sistemada = b tiene una solución si y sólo si b es ortogonal a ¿cuál de los cuatro 
subespacios fundamentales? 

3.8 ¿Qué recta proporciona el mejor ajuste a los datos siguientes: 6 = 0 en r = 0, b = 0 
ení= 1, b = 12 en t = 3? 

3.9 Construya la matriz proyección P sobre el espacio generado por (1, 1, 1) y (0, 1,3). 

3.10 ¿Cuál función constante está más próxima de y = x 4 (en el sentido de mínimos cua¬ 
drados) sobre el intervalo 0£rS 1? 

3.11 Si Q es ortogonal, ¿es cierto lo mismo para Q 3 1 

3.12 Encuentre todas las matrices ortogonales de 3 por 3 cuyos elementos sean ceros y 
unos. 

3.13 ¿Qué múltiplo de a, debe restarse a a 2 , para que el resultado sea ortogonal a a¡? Di¬ 
buje una figura. 

3.14 Factorice 

eos 9 sen 0 
senil 0 

como QR, reconociendo que la primera columna ya es un vector unitario. 

3.15 Si todo elemento de una matriz ortogonal es | o ¿cuál es el tamaño de esta ma¬ 
triz? 

3.16 Suponga que los vectores q u . . . , q„ son ortonormales. Si b = Ciq x + • • • +c n q nt 
proporcione una fórmula para calcular el primer coeficiente c x en términos de b y las 
qs. 


3.17 ¿Qué palabras describen a la ecuación A T Ax = A T b, al vector p = Ax = Pb , y a 
la matriz/ 3 = A(A T A)~'A T ? 

3.18 Si los vectores ortonormales q\ = (f, §, -f) y q 2 = ( -f, §) son las colum¬ 

nas de Q, ¿cuáles son las matrices Q t O y QQ T 7 Demuestre que QQ T es una matriz 
proyección (sobre el plano de q x y q 2 ). 



i 

í 

| 

| 

i 


í 

i 

¡ 

i 

i 

: 

1 

! 
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3.19 Si i)[, ..., v„ es una base ortonormal de R", demuestre que v¡vj + ■ ■ ■ +v n v T = I. 

3.20 iFalso o verdadero ? Si los vectores x y y son ortogonales, y P es una proyección, en¬ 
tonces Px y Py son ortogonales. 

3.21 Intente ajustar una recta b = C + Dt que pasa por los puntos b = 0, t = 2, y b = 6, 
t = 2, y demuestre que las ecuaciones normales fracasan. Dibuje todas las rectas óp¬ 
timas, minimizando la suma de los cuadrados de los dos errores. 

3.22 ¿Cuál punto en el plano x + y- z = 0esel más próximo a b = (2, 1, 0)? 

3.23 Encuentre una base ortonormal de R 3 , empezando con el vector (1,1,— 1). 

3.24 Rastreadores CT examinan a un paciente desde direcciones distintas y producen una 
matriz que proporciona las densidades del hueso y el tejido en cada punto. Matemá¬ 
ticamente, el problema consiste en recuperar una matriz a partir de sus proyecciones. 
En el caso de 2 por 2, ¿es posible recuperar la matriz A si se conoce la suma a lo lar¬ 
go de cada renglón y de cada columna? 

3.25 ¿Es posible recuperar una matriz de 3 por 3 si se conocen las sumas en los renglones, 
las sumas en las columnas y también la suma a lo largo de la diagonal principal, así 
como a lo largo de las otras cuatro diagonales paralelas? 

3.26 Encuentre una base ortonormal del plano x — y + z = 0, y encuentre la matriz P que 
proyecte sobre el plano. ¿Cuál es el espacio nulo de P? 

3.27 Sea A = [3 1 — 1], y sea V el espacio nulo de A. 

a) Encuentre una base para V y una base para V 3 -. 

b) Escriba una base ortonormal para V 3 -, y encuentre la matriz proyección P x que 
proyecta vectores de R 3 sobre V 3 -. 

c) Encuentre la matriz proyección P 2 que proyecta vectores de R 3 sobre V. 

3.28 Aplique el proceso de Gram-Schmidt para construir un par ortonormal q x , q 2 a partir 
de a x = (4, 5, 2, 2) y Ü 2 = (1, 2, 0, 0). Exprese a¡ y a 2 como una combinación de q { 
y q 2 , y encuentre la matriz triangular R en la forma A = QR. 

3.29 Para A, b, x, y y cualesquiera, demuestre que 

a) Si Ajc = b y y 1 A = 0, entonces y T b = 0. 

b) Si Ax — 0 y A T y = b, entonces x T b = 0. 

¿Cuál teorema demuestra esto sobre los subespacios fundamentales? 

3.30 ¿Existe alguna matriz cuyo espacio renglón contenga a (1, 1, 0) y cuyo espacio nulo 
contenga a (0, 1, 1)? 

3.31 La distancia de un plano a T x = c (en el espacio m-dimensional) al origen es |c|/||a||. 
¿Cuán lejos está el plano del origen x t + x 2 — X 3 — x 4 = 8, y cuál punto en éste es el 
más próximo? 

3.32 En el paralelogramo con vértices en 0, v, w, y v + tu, demuestre que la suma de las 
longitudes al cuadrado de los cuatro lados es igual a la suma de las longitudes al cua¬ 
drado de las dos diagonales. 
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3.33 a) Encuentre una base ortonormal para el espacio columna de A. 

"1 -6' 

3 6 

A = 4 8 . 

5 0 

1 8_ 

b) Escriba A como QR, donde Q tiene columnas ortonormales y R es triangular su¬ 
perior. 

c) Encuentre la solución por mínimos cuadrados de Ax = ¿, si h = (—3, 7, 1, 0, 4). 

3.34 Con la matriz de ponderación W = í, ¿1 ¿cuál es al producto interno de (1,0) con 

(0, 1)? L J 

335 Para resolver un sistema rectangular Ax - b, reemplazamos A -1 (que no existe) se 
sustituye por (A T A) _I A T (que existe si las columnas de A son independientes). De¬ 
muestre que ésta es una inversa izquierda de A pero no una inversa derecha. A la iz¬ 
quierda de A proporciona la identidad; a la derecha proporciona la proyección P. 

3.36 Encuentre la recta C + Dt que ajuste mejor las mediciones b = 0, 1, 2, 5 en los ins¬ 
tantes t = 0, 1, 3, 4. 

337 Encuentre la curva y = C + D2‘ que proporcione el mejor ajuste por mínimos cua¬ 
drados a las mediciones y = 6 en r = 0, y = 4 en f = 1, y y = 0 en t = 2. Escriba las 
tres ecuaciones que se resuelven si la curva pasa por los tres puntos, y encuentre los 
mejores C y D. 

338 Si las columnas de A son ortogonales entre sí, ¿qué puede decir sobre la forma de 
A t A? Si las columnas son ortonoimales, ¿qué puede decir entonces? 

339 ¿Qué condición deben cumplir las columnas de A (que puede ser rectangular) para 
que A t A sea invertible? 
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E 4.1 INTRODUCCIÓN 

Los determinantes están mucho más lejos del centro del álgebra lineal de lo que estaban 
hace cien años. ¡Las matemáticas siguen cambiando de dirección! Después de todo, un 
simple número puede decir tanto sobre una matriz. De todos modos, es extraordinario 
cuánto puede hacer este número. 

Un punto de vista es: el determinante constituye una fórmula “explícita” para cada ele¬ 
mento de A -1 y A~ l b. Esta fórmula no modifica la manera de realizar los cálculos; inclu¬ 
so el determinante en sí se encuentra por eliminación. De hecho, la eliminación puede 
considerarse como la manera más eficiente de sustituir los elementos de una matriz de n 
por n en la fórmula. Lo que hace la fórmula es mostrar cómo A -1 depende de los rr ele¬ 
mentos de A, y la forma en que varía cuando los elementos cambian. 

Los usos más importantes de los determinantes pueden enumerarse como se muestra 
a continuación: 

1. Prueban la invertibilidad. Si el determinante de A es cero, entones A es singular. Si 
detA # 0, entonces A es invertible (y A -1 implica 1/det A). 

La aplicación más importante, y la razón por la que este capítulo es esencial para el li¬ 
bro, es en la familia de matrices A — XI. El parámetro X se resta a lo largo de toda la dia¬ 
gonal principal, y el problema consiste en encontrar los valores característicos para los 
cuales A — XI es singular. La prueba es det(A — XI) = 0. Este polinomio de grado n en X 
tiene exactamente n raíces. La matriz tiene n valores característicos. Este hecho se conclu¬ 
ye por la fórmula del determinante, y no por computadora. 

2. El determinante de A es igual al volumen de una caja en el espacio «-dimensional. Las 
aristas de la caja provienen de los renglones de A (véase la figura 4.1). Con las columnas 
de A se obtiene una caja totalmente diferente con el mismo volumen. 

La caja más sencilla es un cubo pequeño dV — dx dy dz, como en Jff f(x, y,z)dV . 
Suponga que se cambia a coordenadas cilindricas mediante x = r eos 9, y = r sen 9, y 
z = z. También que el pequeño intervalo dx se alarga a (dx/du)du —cuando u sustituye a x 
en una simple integral— así el elemento de volumen se convierte en J dr d9 dz. El determi¬ 
nante jacobiano es el análogo tridimensional del factor de alargamiento dxJdu\ 


dx/dr 

dx/B 9 

dx/d z 

eos 9 

—rsen# 

0 

Jacobiano J = dy/dr 

8y/d9 

dy/dz 

= sen0 

r eos 9 

0 

dz/dr 

dz/39 

dz/8z 

0 

0 

1 


El valor de este determinante es J = r. Es la r en el elemento de volumen cilindrico r dr 
d9 dz; este elemento es nuestra pequeña caja. (Al intentar dibujarla se ve curva, aunque qui¬ 
zá se haga más recta a medida que las aristas se vuelven infinitesimales.) 
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Figura 4.1 Caja formada a partir de los renglones de A: volumen = Ideterminantel. 


3. El determinante proporciona una fórmula para cada pivote. Teóricamente, es posible 
pronosticar cuándo un elemento pivote es cero, lo cual requiere un intercambio de renglo¬ 
nes. A partir de la fórmula determinante = ± (producto de los pivotes), se concluye que 
sin importar el orden de la eliminación, el producto de los pivotes permanece igual, salvo 
el signo. 

Hace años, este hecho condujo a la creencia de que era inútil escapar a un pivote 
pequeño intercambiando renglones, ya que al final el pivote pequeño ganaría la partida. 
Sin embargo, lo que suele ocurrir en la práctica, en caso de que no sea posible evitar un 
pivote anormalmente pequeño, es que en muy poco tiempo se presenta un pivote anormal¬ 
mente grande. Así es como el producto se vuelve nuevamente normal, aunque deja en rui¬ 
nas la solución numérica. 


4. El determinante mide la dependencia de A~ l b respecto a cada elemento de b. Si en un 
experimento se cambia un parámetro, o una observación es corregida, el “coeficiente con¬ 
taminante” en A -1 es un cociente de determinantes. 

Hay otro problema respecto al determinante. Es difícil no sólo decidir acerca de su im¬ 
portancia, así como de su lugar idóneo en el álgebra lineal, sino también elegir la mejor de¬ 
finición. Resulta evidente que, det A no es alguna función extremadamente sencilla de rr 
variables; en caso contrario, sería mucho más fácil encontrar A -1 de lo que realmente es. 

Las cuestiones sencillas sobre el determinante no son las fórmulas explícitas, sino 
las propiedades que posee. Esto sugiere un lugar natural para comenzar. El determinante 
puede (como será el caso) definirse mediante sus tres propiedades más importantes: det 
I = 1, el signo se invierte por un intercambio de renglones, el determinante es lineal 
en cada renglón por separado. Entonces el problema es demostrar cómo, usando estas 
propiedades de manera sistemática, es posible calcular el determinante. Esta situación re¬ 
trotrae al producto de los pivotes. 

En la sección 4.2 se explicarán estas tres propiedades definitorias del determinante, así 
como sus consecuencias más importantes. En la sección 4.3 se proporcionarán dos fórmulas 
más para calcular el determinante: la “gran fórmula” con n\ términos y una fórmula por “in¬ 
ducción”. En la sección 4.4, el determinante se aplica para encontrar A -1 . Luego, x — A~ l b 
se calcula con la regla de Cramer. Y finalmente, en una observación opcional sobre permu¬ 
taciones, se demuestra que sin importar el orden en que se apliquen las propiedades, el resul¬ 
tado siempre es el mismo; es decir, las propiedades definitorias son autoconsistentes. 


4.2 Propiedades del determinante 


Esta es una pregunta optimista sobre las permutaciones: ¿cuántos cambios son nece¬ 
sarios para cambiar VISA en AVIS? Esta permutación, ¿es par o impar? 

4.2 PROPIEDADES DEL DETERMINANTE 


Consisten en una lista bastante larga. Por fortuna, cada regla es fácil de encontrar, e inclu¬ 
so más fácil de ilustrar, mediante un ejemplo de 2 por 2. En consecuencia, se comprobará 
que la conocida definición en el caso de 2 por 2, 


det 


a b 


a b 

O 


c d 


— ad — be. 


posee cada propiedad de la lista. (Observe las dos notaciones aceptadas para el determinan¬ 
te, det A y IAI.) Las propiedades de 4 a 10 se deducen de las propiedades previas. Cada 
propiedad es una consecuencia de las tres primeras. Se recalca que las reglas son váli¬ 
das para matrices cuadradas de cualquier tamaño. 


1. El determinante de la matriz identidad es 1 

det/ = 1 o 1 = 1 y 

2. El determinante cambia de signo cuando se intercambian dos renglones. 

c d 

Intercambio de renglones , = cb — ad — — 

a b 

El determinante de cualquier matriz permutación es det P — ± 1. Mediante intercambio de 
renglones es posible transformar P en la matriz identidad. Cada intercambio de renglones 
cambia el signo del determinante, hasta que se llega a det / = 1. ¡De ahí se obtienen todas 
las demás matrices! 



1 0 0 

0 1 0=1 y... 

0 0 1 


3. El determinante depende linealmente del primer renglón. Suponga que A, B, C son 
iguales a partir del segundo renglón, y que el renglón 1 de A es una combinación lineal de 
los primeros renglones de B y C. Entonces la regla establece: det A es la misma combina¬ 
ción que det B y det C. 

Las combinaciones lineales implican dos operaciones: sumar vectores y multiplicar 
por escalares. Por consiguiente, esta regla puede separarse en dos partes: 


Sumar los vectores en el renglón 1 


a + a’ b + b' 
c d 


a b a' b' 

c d c d 


Multiplicar por t en el renglón 1 


ta tb _ a b 
c d 1 c d 


Observe que la primera parte no es la afirmación falsa det(B + O = det B + det C. No es 
posible sumar todos los renglones: sólo se permite cambiar a un renglón. Ambos miembros 
proporcionan la respuesta ad + a’d — be — b'c. 

La segunda parte no es la afirmación falsa det(fA) = t det A. La matriz A tiene un fac¬ 
tor t en cada renglón (y el determinante se multiplica por t "). Es como el volumen de una 
caja, cuando todos los lados se alargan por 4. En n dimensiones, el volumen y el determi¬ 
nante se alargan por 4". Si sólo se alarga un lado, el volumen y el determinante se alargan 
por 4; ésta es la regla 3. Por la regla 2, no hay nada especial respecto al renglón 1. 
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Ahora ya se ha establecido el determinante, aunque este hecho no es nada evidente. 
En consecuencia, las reglas se aplican gradualmente para encontrar el determinante de 
cualquier matriz. 


4, Si dos renglones de A son iguales, entonces det A = 0. 

Renglones iguales \ f I = 


■ ab — ba =0. 


Esto se concluye de la regla 2, ya que si se intercambian los renglones iguales, se supone 
que el determinante cambia de signo. Pero también queda igual, porque la matriz no cam¬ 
bia. El único número capaz de hacer esto es el cero, de modo que det A = 0. (El razona¬ 
miento falla si 1 = —1, que es el caso en álgebra booleana. Así, la regla 4 sustituye a la 
regla 2 como una de las propiedades defmitorias). 

5. Restar un múltiplo de un renglón de otro renglón deja igual al determinante. 


Operación en los renglones 


a — le b — Id 
c d 


a b 
c d 


La regla 3 indica que hay otro término — 1 1 ' j , pero por la regla 4 este término es cero. ¡El 
paso de eliminación de costumbre no afecta al determinante! 

6. Si A tiene un renglón de ceros, entonces det A = 0. 

Renglón cero ® ® =0. 

c d 

Una demostración consiste en sumar otro renglón al renglón cero. Por la regla 5, el deter¬ 
minante permanece sin cambio. Debido a que ahora la matriz cuenta con dos renglones 
idénticos, por la regla 4 se tiene que det A = 0. 

7. Si A es triangular, entonces det A es el producto a n a 22 ■ ■ ■ a nn de los elementos en la 
diagonal. Si la A triangular tiene ls a lo largo de la diagonal, entonces det A = 1. 

Matriz triangular ‘t b , - ad a = ad. 

0 d c d 

Demostración Suponga que los elementos en la diagonal son diferentes de cero. Enton¬ 
ces la eliminación es capaz de eliminar todos los elementos fuera de la diagonal sin modi¬ 
ficar el determinante (por la regla 5). Si A es triangular inferior, los pasos son hacia abajo, 
como de costumbre. Si A es triangular superior, primero se trabaja con la última columna, 
utilizando múltiplos de a m . De cualquier forma se llega a la matriz diagonal D: 


Para encontrar det D, paciente se aplica la regla 3. Al factorizar a u y luego a 22 y por último 
o-mv se obtiene la matriz identidad. Por fin tenemos una aplicación para la regla 1: det / = 1. 


Si un elemento en la diagonal es cero, entonces la eliminación produce un renglón ce¬ 
ro. Por la regla 5, estos pasos de la eliminación no cambian el determinante. Por la regla 6, 
el renglón cero significa un determinante cero. Es decir: cuando una matriz triangular es 
singular (debido a un cero en la diagonal principal), su determinante es cero. 

Esta propiedad es fundamental. El determinante de todas las matrices singulares es 


' 


4.2 Propiedades del determinante 


8. Si A es singular, entonces det A — 0. Si A es invertible, entonces det A A 0. 


Matriz singular 


no es invertible si y sólo si ad — be — 0. 


Si A es singular, la eliminación produce un renglón cero en U. Así, det A - det U - 0. Si 
A es no singular, la eliminación coloca los pivotes d { , . . . , d n en la diagonal principal. ¡Se 
tiene una fórmula para el “producto de pivotes” de det A! El signo depende de si el núme¬ 
ro de intercambio de renglones es par o impar: 

Producto de pivotes det A = ± det U = ± ¿ 1^2 • ■ • d n . (1) 

La regla nueve es la regla del producto. Yo diría que es la más sorprendente. 

9. El determinante de AB es el producto de det A por det B. 

a b e f _ ae + bg af + bh 

Regla del producto |A||B|=|AR| c ¿ g h ~ ce + dg c f + dh ' 


Un caso particular de esta regla proporciona el determinante de A l . Debe ser 1/det A: 

det A -1 = —-— debido a que (det A)(det A -1 ) =detAA _1 = det / = 1. (2) 

det A 

En el caso de 2 por 2, la regla del producto puede comprobarse pacientemente: 

(ad - bc)(eh - fg) = (ae + bg)(cf + dh) - (af + bh)(ce + dg). 

En el caso de n por n, se sugieren dos demostraciones posibles, ya que ésta es la regla me¬ 
nos evidente. En ambas demostraciones se supone que Ay B son no singulares; en caso 
contrario, AB es singular, y la ecuación det AB = (det A)(det B) se comprueba fácilmente. 
Por la regla 8, se convierte en 0 = 0. 

i) Se demostrará que el cociente d(A) — det AB/ det B cumple las propiedades 1 a 3. 
Así, d(A) debe ser igual a det A. Por ejemplo, d(T) = det B/ det B = 1; se cumple 
la regla 1. Si se intercambian dos renglones de A, también se intercambian los mis¬ 
mos renglones de AB, y el signo de d cambia según lo requiere la regla 2. Una com¬ 
binación lineal en el primer renglón de A proporciona la misma combinación lineal 
en el primer renglón de AB. Luego la regla 3 para el determinante de AB, dividida 
entre la cantidad fija det B, lleva a la regla 3 para el cociente d(A). Así, d(A) = det 
AB/ det B coincide con det A, que es nuestra fórmula del producto. 

ii) Esta segunda demostración es menos elegante. Para una matriz diagonal, det DB — 
(det Z»(det B) se concluye al factorizar cada d¡ a partir de su renglón. Una matriz 
general A se reduce a D por eliminación —de A a U como de costumbre, y de U a 
D por eliminación hacia arriba. El determinante no cambia, excepto por una inver¬ 
sión de signo cuando se intercambian renglones. Los mismos pasos reducen AB a 
DB, con precisamente el mismo efecto sobre el determinante. Pero para DB ya se 
confirmó que la regla 9 es correcta. 

10. La traspuesta de A tiene el mismo determinante que A misma: det A T = det A. 

,1 a b a c _ | .ti 
R egla de la traspuesta |A| = ¿ - ¿ ¿ _ I a !• 

De nuevo, el caso singular se trata por separado; A es singular si y sólo si A T es singular, 
y se tiene 0 = 0. Si A es no singular, entonces permite la factorización PA = LDU, y se 
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aplica la regla 9 para el determinante de un producto: 

det P det A = det L det D det U. (3) 

Al trasponer PA = LDU se obtiene A r P T = U T D T L T , y de nuevo por la regla 9, 

det A r det P r — det U r det D T det L r . (4) 

Esto es más sencillo de lo que parece, ya que L, U, L T , y Í/ T son triangulares con diagonal 
de ls. Por la regla 7, su determinante es igual a 1. También, cualquier matriz diagonal es 
igual a su traspuesta: D = D T . Sólo es necesario demostrar que det P = det P r . 

Ciertamente, det P es 1 o — 1, ya que P proviene de / por intercambios de renglones. 
También observe que PP T = I. (El 1 en el primer renglón de P corresponde al 1 en la pri¬ 
mera columna de P r , y le faltan los ls en las demás columnas.) En consecuencia, det P det 
P T — det I = 1, y P y P T deben tener el mismo determinante: ambos 1 o ambos — 1. 

Se concluye que los productos (3) y (4) son los mismos, y entonces det A — det A T . 
Este hecho prácticamente duplica la lista de propiedades, ya que cada regla aplicada a los 
renglones puede aplicarse ahora a las columnas: el determinante cambia de signo cuando 
se intercambian dos columnas, dos columnas iguales (o una columna de ceros) producen 
un determinante cero, y el determinante depende linealmente de cada columna individual. 
La demostración consiste justamente en trasponer la matriz y trabajar con los renglones. 

Considero que es hora de guardar silencio y declarar que la lista está completa. Sólo 
queda encontrar una fórmula definitiva para el determinante, y aplicarla. 

Conjunto de problemas 4.2 

1. Si una matriz de 4 por 4 tiene det A = \, encuentre det(2A), det (-A), det (A 2 ), y det 
(A" 1 ). 

2. Si una matriz de 3 por 3 tiene det A = - 1, encuentre det(| A), det (—A), det (A 2 ) y 
det (A -1 ). 

3. Intercambio de renglones : Sume el renglón 1 de A al renglón 2 y luego reste el ren¬ 
glón 2 del renglón 1. Luego sume el renglón 1 al renglón 2 y multiplique el renglón 1 
por -1 para llegar a B. ¿Cuáles reglas muestran lo siguiente? 

c d 

det B= es igual a —detA = — 

a b 


a b 
c d 


Estas reglas pueden sustituir a la regla 2 en la definición de determinante. 

4. Aplique operaciones en los renglones para obtener una triangular superior U, para 
calcular 


det 


1 2-2 0 ' 

2 3-4 1 

- 1-2 0 2 

0 2 5 3 


y 



Intercambie los renglones 3 y 4 de la segunda matriz, y vuelva a calcular los pivotes 
y el determinante. 


4.2 Propiedades del determinante 


17 


Nota Algunos lectores ya conocerán alguna fórmula para calcular determinantes de 
3 por 3. Tiene seis términos (ecuación (2) de la siguiente sección); tres son paralelos 
a la diagonal principal y otros tres van en dirección opuesta con signo menos. Hay una 
fórmula semejante para determinantes de 4 por 4, aunque contiene 4! — 24 términos 
{no sólo ocho). Ni siquiera es posible estar seguro de que un signo menos va con la 
diagonal invertida, como se muestra en el siguiente ejercicio. 

5. Cuente los intercambios de renglones para encontrar los siguientes determinantes: 


0 0 0 1 
0 0 10 
0 10 0 
10 0 0 


0 10 0 ] 
0 0 10 
0 0 0 1 
10 0 0 


Para cada n, ¿con cuántos intercambios se coloca el (renglón n, renglón n L • • • > 
renglón 1) en el orden normal (renglón 1, . . ., renglón n - 1, renglón «)? Encuentre 
det P para la permutación de n por n con unos en la diagonal invertida. En el proble¬ 
ma 5 se tenía n — 4. 


7. Encuentre el determinante de: 

a) Una matriz de rango 1 


b ) La matriz triangular superior 


4 [2 -1 2] 

2 


'4 4 8 8 
0 12 2 
0 0 2 6 
0 0 0 2 


c) La matriz triangular inferior U r . 

d) La matriz inversa U~ l . 

e) La “matriz triangular invertida” que resulta de intercambios de renglones, 


0 0 0 2 ] 
0 0 2 6 ] 
0 12 2 
4 4 8 8 


8. Demuestre cómo la regla 6 (det = 0 si un renglón es cero) proviene directamente de 
las reglas 2 y 3. 

9. Suponga que realiza dos operaciones a la vez, yendo de 


a b 


a — me 

b 

— md 

c d 

<* 

c — la 

d 

-ib ‘ 


Encuentre el determinante de la nueva matriz, aplicando la regla 3 o por cálculo directo. 

10. Si Q es una matriz ortogonal, de modo que Q r Q = I, demuestre que det Q es igual a 
+1 o -1. ¿Qué tipo de caja se forma a partir de los renglones (o las columnas) de _ . 

11. Demuestre otra vez que det Q = 1 o -1, usando sólo la regla del producía Si |det Q\ 
> 1, entonces det Q 1 explota. ¿Cómo se sabe que esto no puede ocurrir a (¿ . 
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12. Use operaciones en los renglones para justificar que el “determinante de Vandermon- 
de” de 3 por 3 es 

1 a a 2 

det 1 b b 2 — (b — a){c — a)(c — b). 
lee 2 

Sr T = — K, como en 


13. a) Una matriz simétrica sesgada cumple K 

0 a b 

K = -a 0 c . 

—b —c 0 

En el caso de 3 por 3. ¿por qué det (-K) = (- 1) 3 det K r > Por otra parte, det K T - 
det K (siempre). Deduzca que el determinante debe ser cero. 
tí) Escriba una matriz simétrica sesgada de 4 por 4 con det K diferente de cero. 

14. ¿Falso o verdadero? Proporcione una razón si es cierto, y un contraejemplo si es fal- 


a) Si Ay B son idénticas excepto que b u = 2a n , entonces det B = 2 det A. 
tí) El determinante es el producto de los pivotes. 

c) Si A es invertible y B es singular, entonces A + B es invertible. 

d) Si A es invertible y B es singular, entonces AB es singular. 

e) El determinante de AB — BA es cero. 

15. Si la suma de cada renglón de A es cero, demuestre que det A = 0. Si la suma de ca¬ 
da renglón es 1, demuestre que det (A — 1) = 0. Demuestre con un ejemplo que esto 
no implica que det A = I. 

16. Encuentre los siguientes determinantes de 4 por 4 por eliminación gaussiana: 


'11 

12 

13 

14 1 

' 1 

t 

t 2 

21 

22 

23 

24 

t 

1 

t 

31 

32 

33 

34 y det 

t 2 

t 

1 

41 

42 

43 

44 J 

t 3 

t 2 

t 


17. Encuentre los determinantes de 
A-ff ?L A~ l = - 


A-XI 


4-X 2 

1 3 — X 


¿Para qué valores de A se cumple que A — AI es una matriz singular? 

18. Evalúe det A reduciendo la matriz a forma triangular (reglas 5 y 7). 


1 1 3 
0 4 6 
1 5 8 


1 1 3 
0 4 6 
0 0 1 


113 
0 4 6 
1 5 9 


¿Cuáles son los determinantes de B, C, AB, A r A, y C T ? 


1>\ Suponga que CD — DC, y encuentre la falla en el siguiente razonamiento: Al tomar 
determinantes se obtiene (det Q(det D) = -(det D)(det Q, de modo que det C = 0 
o det D — 0. Así, CD = —DC sólo es posible si C o D es singular. 


4.2 Propiedades del determinante 
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20. ¿El determinante de las siguientes matrices es igual a 0, 1, 2, o 3? 


0 0 1 
1 0 0 
0 1 0 


0 1 1 
1 0 1 
1 1 0 


1 1 1 
1 1 1 
1 1 1 


21. Parece que la inversa de una matriz de 2 por 2 tiene determinante = 1: 

, , 1 \ d -b 1 ad-bc 

ad — be l~c a J ad — be 

¿Qué está mal en este cálculo? ¿Por qué es correcto det A” 1 ? 

En los problemas 22 a 28 se usan reglas para calcular determinantes específicos. 

22. Reduzca A a U, y encuentre det A = producto de los pivotes: 

'1 1 ll fl 2 3" 

A = 12 2 y A = 2 2 3. 

1 2 3J |_3 3 3_ 

23. Aplique operaciones en los renglones para obtener una triangular superior U, y calcule 


1 

2 

3 

0' 


'2 

1 

1 

r 

2 

6 

6 

1 


1 

2 

1 

i 

1 

0 

0 

3 y 

det 

1 

1 

2 

i 

0 

2 

0 

7 


1 

1 

1 

2 


24. Aplique operaciones en los renglones para simplificar y calcular los siguientes deter¬ 
minantes: 


'101 

201 

301" 


102 

202 

302 y 

det 

103 

203 

303 



25. La eliminación reduce A a U. Luego, A = LU: 

3 3 4] f 1 0 01 [3 3 4' 

A= 687=210 02 -1 = LU. 

-3 5 —9J [-1 4 1J |_° 0 -1_ 

Encuentre los determinantes de L, U, A, y U~ l L~~ l A. 

26. Si a¡j es i multiplicado por j, demuestre que det A = 0. (Con la excepción cuando 

/I = [I]-) 

27. Si a¡j es i + j, demuestre que det A = 0. (Con la excepción cuando n = 1 o 2.) 

28. Calcule los determinantes de las siguientes matrices, mediante operaciones en los ren¬ 
glones: 

r _ [0 fl 0 Ol r -1 

0 a 0 o 0 b 0 a a a 

A — 0 0b, S= o n 0 c ’ 7 C= a b b . 

- c 0 °j d 0 0 0J I a b c \ 

29. ¿Cuál es el error en la siguiente demostración de que las matrices proyección cumplen 
det P = 1? 


a a a 
a b b 
abe 


A(A t A) l A r demodoque |P| = |A| 


A|-1 A 1 

|A T ||A| 
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30. (Problema de cálculo) Demuestre que las derivadas parciales de ln(det A) proporcio¬ 
nan A -1 : 


f{a, b, c, d) — ln (ad — be) conduce a 


’df/da df/dc' 
_df/db df/dd 


A" 1 . 


31. (MATLAB) La matriz de Hilbert hilb(n) tiene el elemento i, j igual a l/(¿ + j — I). 
Imprima los determinantes de hilb(l), hi!b(2), . . . , hilb(10). ¡Es difícil trabajar con 
las matrices de Hilbert! ¿Cuáles son los pivotes? 


32. (MATLAB) ¿Cuál es un determinante típico (experimentalmente) de rand(n) y 
rarsdn(n) para n = 50, 100, 200, 400? (¿Y qué significa “lnf’ en MATLAB?) 


33. Use MATLAB para encontrar el determinante más grande de una matriz de 4 por 4 de 
Os y Is. 


34. Si se sabe que det A = 6, ¿cuál es el determinante de S? 

renglón 1 renglón 1 + renglón 2 

det A = renglón 2 =6 det B = renglón 2 + renglón 3 
renglón 3 renglón 3 + renglón 1 

35. Suponga que la matriz M de 4 por 4 tiene cuatro renglones iguales, todos contenien¬ 
do a , b, c, d. Se sabe que det (M) = 0. El problema es encontrar det(/ + Ai) por cual¬ 
quier método: 

1 + a b c d 
a 1 + b c d 
a b 1 + c d 
a b c 1 + d 

Crédito parcial si encuentra este determinante cuando a = ¿> = c = d= 1. Eliminado 
de inmediato si afirma que det(/ + M) = det / -i det M. 


det (/ + M) = 



4.3 FÓRMULAS PARA EL DETERMINANTE 

La primera fórmula ya apareció. Las operaciones en los renglones producen los pivotes en D: 

4A Si A es invertible, entonces PA — LDU y det P = ± 1. La regla del producto da 

det A =± det Z, det D det í/ = ± (producto de Los pivotes). (1) 

El signo ± 1 depende de si el número de intercambios de renglones es par o impar. 
Los factores triangulares tienen det L = det U = 1 y det D = d x • ■ ■ d n . 

En el caso de 2 por 2, la factorización estándar LDU es 

a b _ \ 0 a 0 1 b/a 

c c/a 1 0 (ad — bc)/a 0 1 

El producto de los pivotes es ad — be. Este es el determinante de la matriz diagonal D. Si 
el primer paso es un intercambio de renglones, entonces los pivotes son c y (—det A)/c. 


4.3 Fórmulas para el determinante 
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Ejemplo 1 Los pivotes de la matriz —1,2, — 1 en segundas diferencias son 2/1, 3/2, ... en D: 


'2-1 


'2 

-1 2 -1 


3/2 

-1 2 

= LDU = L 

4/3 

• -1 



-1 2 


(n + 1)/ n 


Su determinante es el producto de los pivotes. Todos los números 2,.... n se cancelan: 
. . . /3\ /4\ (n + 1\ 


an 

a n 

a\2 

021 

022 

023 

a 3 i 

Oy2 

033 


MATLAB calcula el determinante a partir de los pivotes. Sin embargo, concentrar toda la 
información en los pivotes hace imposible imaginarse cómo el cambio en un elemento pue¬ 
de afectar al determinante. Se desea encontrar una expresión explícita para el determinan¬ 
te en términos de los n 2 elementos. 

Para n = 2, se demostrará que ad — be es correcto. Para n = 3, la fórmula del deter¬ 
minante es bastante bien conocida (tiene seis términos): 


_ +«11^22^33 + ai2«23«31 + <2l3«21<232 
~ nU^23«32 — <3!2<22l«33 _ «13022031- 


Nuestro objetivo es deducir estas fórmulas directamente a partir de las propiedades defini- 
torias 1 a 3 de det A. Si es posible manejar n = 2yn = 3de manera organizada, podrá ver¬ 
se el patrón. 

Para empezar, cada renglón puede descomponerse en vectores en las direcciones de 
coordenadas: 

[n b ] = [<2 0] + [0 b] y [c d] = [c 0] + [0 d]. 

Luego se aplica la propiedad de linealidad, primero al renglón 1 y luego al renglón 2: 


Separar en 
n n = 2 2 

determinantes fáciles 


Cada renglón consta de n direcciones de coordenadas, por lo que su desarrollo contiene n 2 
términos. La mayor parte de tales términos (todos menos n\ — n factorial) son automática¬ 
mente cero. Cuando dos renglones están en la misma dirección de coordenadas, uno es 
múltiplo del otro, y 


a 0 

+ 

0 

b 

c d 

c d 

a 0 

+ 

a 0 j 

c 0 

0 

d 


Se presta atención sólo cuando los renglones apuntan en distintas direcciones. Los térmi¬ 
nos diferentes de cero deben estar en columnas distintas. Suponga que el primer renglón 
tiene un elemento diferente de cero en la columna a, el segundo, un elemento diferente de 
cero en la columna /3, y que finalmente el renglón n-ésimo tiene un elemento diferente 
de cero en la columna v. Todos los números de columna a, (3, . . ., v son diferentes. Son 
un reordenamiento, o permutación , de los números 1,2,.... n. El caso de 3 por 3 pro- 
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duce 3! = 6 determinantes: 


a u a 3 2 a\ 3 


«11 


«12 


a i3 

«21 <222 a 23 

= 

«22 

+ 

«23 

+ 

«21 

<*31 «32 «33 


^33 


«31 


«32 



«11 


«12 


«13 

+ 

«23 

+ 

«21 

+ 

«22 


«32 


«33 


«31 


Excepto estos ni determinantes, todos los demás son cero porque la columna se repi¬ 
te. (Para la primera columna a hay n opciones, para j8 hay n— 1 opciones restantes, y por 
último, queda una opción para la última columna v. Cada vez se utiliza una sola columna, 
cuando se “serpentean” los renglones de la matriz). En otras palabras, hay n ! formas de 
permutar los números 1, 2Los números de columna proporcionan las permuta¬ 
ciones: 

Números de columna (a, /3, v)=(l, 2, 3), (2, 3, 1),(3, 1, 2),( 1, 3, 2), (2, 1, 3), (3, 2, 1). 

Hay 3! = 6 permutaciones de (1, 2, 3); la primera es la identidad. 

El determinante de A se reduce ahora a seis determinantes por separado y mucho más 
sencillos. Al factorizar a¡¡, para cada una de las seis permutaciones hay un término: 


1 


1 


1 

1 

+ «12«23«31 

1 

+ «13«21«32 

1 

1 


1 


1 


+ «11«23«32 

1 

1 

+ «12«21«33 

1 

1 

+ «13«22«31 

1 

1 


1 


1 


1 


Cada término es un producto de n = 3 elementos a y , donde cada renglón y cada columna 
están representados una vez. Si el orden de las columnas es (a, ... , v), ese término es el 
producto de a ía ■ ■ ■ a nv por el determinante de una matriz permutación P. El determinan¬ 
te de toda la matriz es la suma de estos n! términos, y esa sumatoria es la fórmula explí¬ 
cita que se está buscando: 

i det A = (ai a fl 2 ff • • • a nv ) det / 

todas las Ps 

Para una matriz de n por n, esta sumatoria se toma sobre todas las ni permutaciones 
(a, . . . ,v) de los números (1, ...,«). La permutación proporciona los números de co¬ 
lumna a medida que se desciende por la matriz. Los ls aparecen en P en los mismos si¬ 
tios en que las as aparecían en A. 

Queda por encontrar el determinante de P. Los intercambios de renglones transforman 
P en la matriz identidad, y cada intercambio cambia el signo del determinante: 

det P = +1 o — 1 para un número par o impar de intercambios de renglones. 




(1,3,2) 


es impar, 
de modo que 


1 

es par. 

1 

1 

— —1 (3,1,2) d e moc i 0 q Ue 

1 

1 

1 
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(1, 3, 2) requiere un intercambio y (3, 1, 2) requiere dos intercambios para recuperar (1, 2, 
3). Estos son dos de los seis signos ±. Para n — 2, sólo se tiene (1, 2) y (2, 1): 

det A = a¡¡022 det ^ j + «121321 det ^ ^ = «n«22 — «i2«2i ( o ad — be). 

Nadie puede afirmar que la gran fórmula (6) es particularmente simple. Sin embargo, 
es posible darse cuenta de por qué tiene las propiedades 1 a 3. Para A = I, todo producto 
de los a¡j es cero, excepto por la sucesión de columnas (1,2Este término propor¬ 
ciona det I = 1. La propiedad 2 se comprobará en la siguiente sección, porque aquí se tie¬ 
ne más interés en la propiedad 3: el determinante debe depender linealmente del primer 
renglón a n , a l2 ,... , « ln . 

Considere a todos los términos a lcí a 2 g ■ ■ • a nv que implican a a n . La primera colum¬ 
na es a = 1. Esto deja alguna permutación (J3, . . . , v) de las columnas restantes (2, , 

n ). Todos estos términos se agrupan como a u C n , donde el coeficiente de « u es un deter¬ 
minante más pequeño, al que se han retirado el renglón 1 y la columna 1: 

Cofactor de a u Cu = • • • a nv ) det P = det (submatriz de A) (7) 

De manera semejante, el elemento a 12 se ha multiplicado por algún determinante más pe¬ 
queño Cj 2 . Al agrupar todos los términos que empiezan con el mismo a y, la fórmula (6) se 
convierte en 

Cofactores a lo largo del renglón 1 det A = «nCji + « 12 C 12 + ■ ■ ■ +a ln C tn . (8) 

Esto demuestra que det A depende linealmente de los elementos a n , . . . , a¡„ del primer 
renglón. 

Ejemplo 2 Para una matriz de 3 por 3, con esta manera de agrupar términos se obtiene 

det A = «u(«22«33 ~ «23«32) + «12(«23«31 ~ «21«33) + «13(«21«32 — «22«3l)- (9) 

Los cofactores C u , C I2 , C I3 son los determinantes de 2 por 2 entre paréntesis. 

Desarrollo de det A por cofactores 

Se busca otra fórmula más para el determinante. Si esto significa partir de cero, sería de¬ 
masiado. Sin embargo, la fórmula ya está descubierta: es (8), y la única cuestión es iden¬ 
tificar los cofactores C^j que multiplican a a xj . 

Se sabe que Cy depende de los renglones 2, .... n. El renglón 1 ya está tomado en 
cuenta por a XJ . Además, a 1J también toma en cuenta la columna j-ésima, de modo que su 
cofactor Cy debe depender por completo de las otras columnas. Ningún renglón ni colum¬ 
na puede usarse dos veces en el mismo término. Lo que realmente se está haciendo es se¬ 
parar el determinante en la siguiente suma: 


Separación 

«n 

«12 

«13 


«11 





«12 



«13 

en 

«21 

«22 

«23 

= 


«22 

«23 

+ 

«21 

«23 


«21 

«22 

cofactores 

«31 

«32 

«33 



«32 

«33 


«31 

«33 


«31 

«32 


Para un determinante de orden n, esta separación origina n determinantes más pequeños 
(menores ) de orden n — 1 ; se puede ver las tres submatrices de 2 por 2. La submatriz My 
se forma quitando el renglón 1 y la columna j. Su determinante se multiplica por ay, así co¬ 
mo por un signo más o menos. Estos signos alternan como en det M n , —det M l2 , det M 13 : 
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Cofactores del renglón 1 Cij = (— 1) 1 +; det M 17 . 

El segundo cofactor Cj 2 es u 2 3 a 3 i — ® 2 i a 33 ’ c l ue es det M\ 2 multiplicado por — 1. Esta mis¬ 
ma técnica funciona en toda matriz de n por n. La separación anterior confirma que C u es 
el determinante del ángulo inferior derecho M u . 

Hay un desarrollo semejante en cualquier otro renglón, por ejemplo i. Puede demos¬ 
trarse intercambiando el renglón i con el renglón 1. Recuerde borrar el renglón i y la co¬ 
lumna j de A para M¡¡. 

4B El determinante de A es una combinación de cualquier renglón i multiplicado 
por .sus cofactores: 

det A por cofactores det A = a¡¡C n + a i2 Ci 2 + ■ ■ ■ +a in Cin- (10) 

El cofactor C y es el determinante de M ¿j con el signo correcto: 

borrar el renglón i y la columna/ C, 7 = (~l) i+J det M¡j. .(11) 

Estas fórmulas expresan det A como una combinación de determinantes de orden 
n - 1. Hubiera sido posible definir el determinante por inducción sobre n. Una matriz de 1 
por 1 tiene det A = a n , y así la ecuación (10) define los determinantes de las matrices de 
2 por 2, de 3 por 3, y de n por n. Aquí se prefirió definir un determinante según sus propie¬ 
dades, que son mucho más simples de explicar. La fórmula explícita (6) y la fórmula de co¬ 
factores (10) se concluyeron directamente, a partir de esas propiedades. 

Hay una consecuencia más de det A = det A T . Es posible desarrollar por cofactores de 
una columna de A, que es un renglón de A T . Siguiendo por la columna y de A, 

det A = a\jC\¡ + a 2 jC 2 ] + ' • • +a nj C n j. (12) 

Ejemplo 3 La matriz en segundas diferencias A 4 de 4 por 4 sólo tiene dos elementos diferentes de ce¬ 
ro en el renglón 1: 


Usar cofactores 


2 -1 

-1 2 

0 -1 

0 0 


o o' 
-1 o 
2 -1 ‘ 
-1 2 


Ci 1 proviene al borrar el renglón 1 y la columna 1, quedando así el patrón -1, 2, -1: 

' 2-1 0 ' 

Cu =detA 3 = det —1 2 —1 . 

0 -1 2 _ 

Para a 12 = — 1, la columna eliminada es la 2, y se requiere su cofactor C 12 : 

r-1 _1 °1 r2 -íl 

c„ = ( —l) 1+2 det 0 2-1 = +det , - =detA 2 . 


'-1 

-1 

0' 

r 2 

-r 

0 

2 

-1 

= + det _ j 

2 

0 

-1 

2 



Así se queda con el determinante de 2 por 2. En total, el renglón 1 ha producido 2C U C 12 : 
det A 4 = 2(det A 3 ) — det A 2 = 2(4) —3=5 


La misma idea es válida para A s y A 6 , así como para toda A„: 

Recurrencia por cofactores det A n = 2(det A„- 1 ) — det A„_ 2 . 


( 13 ) 





0 i i 7 3 8 
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Lo anterior proporciona el determinante de matrices cada vez más grandes. En cada paso, 
el determinante de A„ es n + 1, a partir de los determinantes previos n y n — 1: 

matriz -1, 2, -1 det A„ = 2 (n) - (n - 1) = n + 1. 


La respuesta n + 1 coincide con el producto de pivotes al inicio de esta sección. 



gg Conjunto de problemas 4.3 


1. Para las siguientes matrices, encuentre el único elemento diferente de cero en la gran 
fórmula ( 6 ): 

'0 1 0 0 ] [0 0 1 - 2 ' 

,10 10 _ _ 0 3 4 5 

A 0101 y B 6789' 

o o 1 oj [0001 

Sólo hay una forma de elegir cuatro elementos diferentes de cero de renglones distin¬ 
tos y columnas distintas. Al decidir par o impar, calcule det A y det B. 

2. Desarrolle estos determinantes en cofactores en el primer renglón. Encuentre los co¬ 
factores (incluyen los signos (— l)‘ +y ) y los determinantes de A y B. 

3. ¿Falso o verdadero ? 

a) El determinante de S~ l AS es igual al determinante de A. 

b) Si det A = 0, entonces por lo menos uno de los cofactores debe ser cero. 

c) Una matriz cuyos elementos son Os y ls tiene determinante 1, 0, o — 1. 

4. a) Encuentre la factorización LU, los pivotes, y el determinante de la matriz de 4 por 

4 cuyos elementos son a y = el menor de i y j. (Escriba la matriz.) 
b) Encuentre el determinante si a¡j = el menor de n¡ y n¡, donde n¡ = 2, n 2 = 6 , n 3 = 8 , 
n 4 = 10. ¿Puede proporcionar una regla general para cualquier raí < n 2 < «3 < n 4 ? 

5. Sea F„ el determinante de la matriz tridiagonal 1, 1, —1 (de n por n): 



Desarrolle por cofactores a lo largo del renglón 1, para demostrar que F„ = F n - t + 
F„_ 2 . Esto lleva a la sucesión de Fibonacci 1, 2, 3, 5, 8, 13,... para los determinantes. 

6. Suponga que A„ es la matriz tridiagonal n por n con ls en las tres diagonales: 

r, fl 1 0' 

A! = tu, a 2 = ; ; , A 3 = 1 1 1 , ... 

L -i L° 1 l . 

Sea D n el determinante de A„; se requiere encontrarlo. 

a) Desarrolle por cofactores a lo largo del primer renglón para demostrar que D n = 
D n ~ i — D n - 2 . 

b) Empiece con D l ~ 1 y D 2 = 0, para encontrar D 3 , £) 4 , .... D s . Observe la mane¬ 
ra en que estos números se repiten (¿con qué periodo?), y encuentre D ¡000 . 
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7. a) Evalúe el siguiente determinante por cofactores del renglón 1 : 

4 4 4 4 

12 0 1 
2 0 12 ' 

110 2 

b) Compruebe restando la columna 1 de las demás columnas, y vuelva a calcular. 

8. Calcule los determinantes de A 2 , A 3 , A 4 . ¿Puede pronosticar A n ? 


0 1 1 
1 0 1 
1 1 0 


0 111 
10 11 
110 1 
1110 


Use operaciones en los renglones para producir ceros, o use los cofactores del renglón 1. 

9. ¿Cuántas multiplicaciones se requieren para encontrar un determinante de n por n a 
partir de 

a) la gran fórmula (6)? 

tí) la fórmula de cofactores (10), construyendo a partir del conteo para n — 1? 
c) la fórmula del producto de pivotes (incluyendo los pasos de eliminación)? 

10. En una matriz de 5 por 5, ¿un signo + o un signo — con ai 5 < 224 £í 33 « 42 « 5 i invierte la 
diagonal? En otras palabras, P = (5, 4, 3, 2, 1) ¿es par o impar? El patrón de tablero 
de ajedrez de signos ± para cofactores no proporciona det P. 

11. Si A es de m por n y B es de n por m, explique por qué 

det [ 0 ^ 1 = det AS. ( ( Su 8 erenci ^- posmultiplicar [ / 0] \ 

—B I J por la derecha por) \_B / J ) 


Proporcione un ejemplo con m < n, y un ejemplo con m > n. ¿Por qué su segundo 
ejemplo automáticamente tiene det AB = 0? 

12. Suponga que la matriz A es fija, excepto que a u varía desde —oo hasta +co. Propor¬ 
cione ejemplos en los cuales det A siempre es cero o nunca es cero. Luego, a partir del 
desarrollo por cofactores (8), demuestre que en caso contrario det A = 0 para exacta¬ 
mente un valor de a u . 

En los problemas 13 a 23, use la gran fórmula con ni términos: J A¡ = S =b a la a 2 ¿ 


13. Calcule los determinantes de A, B, C, a partir de seis términos. ¿Sus renglones son in¬ 
dependientes? 


1 2 3 
3 1 2 
3 2 1 


1 2 3 

4 4 4 

5 6 7 


1 1 1 

110. 
1 0 0 


14. Calcule los determinantes de A , B, C. ¿Sus columnas son independientes? 


1 1 0 
1 0 1 
0 1 1 


1 2 3 
4 5 6 
7 8 9 
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15. Demuestre que det A = 0, sin importar los cinco elementos diferentes de cero indica¬ 
dos por las xs: 

XXX 

A = 0 0 x . (¿Cuál es el rango de A?) 

0 0 x 

16. Este problema muestra en dos formas que det A = 0 (las xs son números cualesquiera): 

x x x x x 

x x x x x 

A = 0 0 0 x x 

0 0 0 x x 

0 0 0 x x 

a) ¿Cómo se sabe que los renglones son linealmente dependientes? 

tí) Explique por qué todos los 120 términos son cero en la gran fórmula para det A. 

17. Encuentre dos formas para elegir elementos diferentes de cero, a partir de cuatro ren¬ 
glones y columnas diferentes: 

1 
0 
5 
2 

det A, ¿es igual a 1 + 1 o 1 — lo — 1 — 1?¿A qué es igual det 5? 

18. Coloque el menor número de ceros en una matriz de 4 por 4 que garantice det A = 0. 
Coloque tantos ceros como sea posible permitiendo a la vez que det A ¥= 0. 

19. a) Si a n = a 22 = «33 = 0, ¿cuántos de los seis términos en det A son cero? 

tí) Si a u = a 2 2 = a 33 = £¡44 = 0, ¿cuántos de los 24 productos ai ¡a 2 kaua 4m en det A 
es seguro que son cero? 

20. ¿Cuántas matrices permutación de 5 por 5 tienen det P = +1? Estas son permutacio¬ 
nes pares. Encuentre una que requiera cuatro intercambios para llegar a la matriz iden¬ 
tidad. 

21. Si det A i= 0, por lo menos uno de los ni términos en la gran fórmula (6) no es cero. 
Deduzca que algún ordenamiento de los renglones de A no deja ceros en la diagonal. 
(No use P de la eliminación; esa PA puede tener ceros en la diagonal.) 

22. Demuestre que 4 es el determinante más grande para una matriz de 3 por 3 de ls po¬ 
sitivos y ls negativos. 

23. ¿Cuántas permutaciones de (1, 2, 3, 4) son pares, y cuáles son? Crédito extra: ¿Cuá¬ 
les son todos los posibles determinantes de 4 por 4 de / + P par ? 

En los problemas 24 a 33 se usan cofactores C¡j — (—l) i+j det M¡¡. Elimine el ren¬ 
glón i, columna j. 

24. Encuentre cofactores, y luego trasponga. ¡Multiplique cj y Cj por A y B! 


0 0 2 
3 4 5 

^ q 2 . (B tiene los mismos ceros que A). 
0 0 1 


'1 

0 

0 

r 


0 

1 

1 

1 

B = 

1 

1 

0 

1 

1 

0 

0 

1 



matriz de 5 por 5 
matriz cero de 3 por 3 
Siempre es singular 


A = 


2 1 
3 6 


B = 


1 2 3 
4 5 6 
7 0 0 
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31. Calcule los determinantes S t , S 2 , S 3 de las siguientes matrices tridiagonales: 


3 1 I 

3 

1 

0 

1 31 

S 3 = l 

3 

1 . 

0 

1 

3 


Haga una conjetura de Fibonacci para S 4 , y compruebe que tiene razón. 

32. Los cofactores de estas matrices 1,3 1 proporcionan S n = 3S„--i — S n -2 • Desafío: De¬ 
muestre que S n es el número de Fibonacci F-^n+i demostrar F 2 „+ 2 = 3F 2 „ — F 2 „_ 2 . 

Siga utilizando la regla de Fibonacci F k = F k -i + Ft- 2 - 

33. Cambie 3 por 2 en la esquina superior izquierda de ¡as matrices en el problema 32. 
¿Por qué se resta S„_ ¡ del determinante S„? Demuestre que los determinantes se con¬ 
vierten en los números de Fibonacci 2, 5, 13 (siempre F 2n+l)- 

Los problemas 34 a 36 son sobre matrices en bloque y determinantes en bloque. 

34. Con bloques de 2 por 2, ¡no siempre es posible usar determinantes en bloque! 


A 

s 


A 

B 

0 

D = I A II D I 

pero 

C 

D 


f\A\\D\ 


a) ¿Por qué es cierta la primera afirmación? De alguna manera, B no entra. 

b ) Demuestre con un ejemplo que la igualdad falla (como se muestra) cuando entra C. 

c ) Demuestre con un ejemplo que la respuesta det(A£> — CB) también es errónea. 

35. Con multiplicación por bloques, A = LU tiene A k = L k U k en la esquina superior iz¬ 
quierda: 


A k * 
* * 


jLfc 0 U k H 5 
* * 0 * 


a) Suponga que los tres primeros pivotes de A son 2, 3, —1. ¿Cuáles son los determi¬ 
nantes de Lj, Lj, L 3 (con Is en la diagonal), U 1 , U 2 , U 3 , y A u A 2 , A 3 ? 

b ) Si A^ A 2 , A 3 tienen determinantes 5, 6 , 7, encuentre los tres pivotes. 

36. En la eliminación por bloque se resta CA~ l multiplicado por el primer renglón [A B ] 
del segundo renglón [C D\. Así, en la esquina queda el complemento de Schur D — 
CA~ l B: 


A B 

0 D — CA~ l B 


Tome determinantes de estas matrices para demostrar reglas correctas para bloques 
cuadrados: 


A B 
C D 


\A\\D - CA~ l B\ 


37. Un determinante de 3 por 3 tiene tres productos “abajo a la derecha” y tres “abajo a la 
izquierda” con signos menos. Calcule los seis términos de la figura para encontrar D. 
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Luego explique sin determinantes por qué la siguiente matriz es invertible o no: 


D = 


_ _ _ _}_ 

38. Para A 4 en el problema 6, cinco de los 4! = 24 términos en la gran fórmula (6) son di¬ 
ferentes de cero. Encuentre estos cinco términos para demostrar que D 4 — — 1. 

39. Para la matriz tridiagonal de 4 por 4 (elementos —1,2, —1), encuentre los cinco tér¬ 
minos en la gran fórmula con los que se obtiene det A = 16 — 4 — 4 — 4+ 1. 

40. Encuentre el determinante de la siguiente matriz cíclica P por cofactores del renglón 

1. ¿Con cuántos intercambios se reordena 4, 1, 2, 3 en 1, 2, 3, 4? es ¿IP 2 I = +1 o — 1? 

'0 0 0 1 ] [0 0 1 0' 

íooo 2 = o o o i ro /' 

^ 0100 F 1000 [7 0 • 

0 0 1 OJ L° 1 0 °J 

41. A = 2*eye (n)— d¡ag(ones(n — 1, 1), 1)—d¡ag(ones(n—1, 1),—1) es la matriz —1, 

2, —1. Cambie A(l, 1) a 1 de modo que det A — 1. Pronostique los elementos de A ” 1 
con base en n = 3, y pruebe su conjetura para n = 4. 

42. (MATLAB) Las matrices —1, 2, —1 tienen determinante n + 1. Calcule ( n + 1)A -1 
para n = 3 y 4, y compruebe su conjetura para n — 5. (Las inversas de las matrices 
tridiagonales tienen la forma uv T de rango 1 arriba de la diagonal.) 

43. Todas las matrices de Pascal tienen determinante 1. Si 1 se resta del elemento n, n, 
¿por qué el determinante se vuelve cero? (Use la regla 3, o cofactores). 

' i i i 11 fi i i r 

1234 1234 

det j g 6 10 = ^ conoc id° det ^ 3 g 10 = ® (explique). 

1 4 10 20 1 4 10 19 



M 4.4 APLICACIONES DE LOS DETERMINANTES 

En esta sección se desarrollan cuatro aplicaciones fundamentales: la inversa de A, la solu¬ 
ción de Ax = b, el volumen de cajas y los pivotes. Estas aplicaciones se encuentran entre 
los cálculos clave en álgebra lineal (realizados por eliminación). Los determinantes propor¬ 
cionan fórmulas para las respuestas. 

1. Cálculo de A -1 . El caso de 2 por 2 ilustra cómo los cofactores van en A -1 : 


1 

d 

-b 

1 

*C n 

C 21 

ad — be 

—c 

a 

det A 

_Ci2 

C 2 2 _ 


Se está dividiendo entre el determinante, y A es invertible exactamente cuando det A es di¬ 
ferente de cero. El número C n = d es el cofactor de a. El número C 12 = — c es el cofac- 
tor de b (observe el signo menos). ¡Ese número C 12 va en el renglón 2, columna 1! 
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El renglón a, b multiplicado por la columna C n , C 12 produce ad — be. Este es el de¬ 
sarrollo por cofactores de det A. Esta es la pista que se requiere: A -1 divide los cofactores 
entre det A. 



La matriz de cofactores 
C está traspuesta 


Nuestro objetivo es comprobar esta fórmula para A 1 . Es necesario ver por qué AC T = (det 
A)/: 



Con los cofactores C u , . . . , C¡„ en la primera columna y no en el primer renglón, se 
multiplican a a n , ... , a ln y proporcionan el elemento diagonal det A. Cada renglón 
de A multiplica a sus cofactores (el desarrollo por cofactores) para obtener la misma res¬ 
puesta det A sobre la diagonal. 

La pregunta crítica es: ¿ Por qué se obtienen ceros fuera de la diagonal ? Si se combi¬ 
nan los elementos a XJ del renglón 1 con los cofactores C 2J del renglón 2, ¿por qué el resul¬ 
tado es cero? 

renglón 1 de A, renglón 2 de C « 11 C 21 + a l2 C 22 + • • • + a\ n C 2n =0. (3) 

La respuesta es: se está calculando el determinante de una nueva matriz B, con un nuevo 
renglón 2. El primer renglón de A se copia en el segundo renglón de B. Así, B tiene dos 
renglones iguales, y det B — 0. La ecuación (3) es el desarrollo de det B a lo largo de 
su renglón 2, donde B tiene exactamente los mismos cofactores que A (porque el segundo 
renglón se elimina para encontrar esos cofactores). La extraordinaria multiplicación matri- 
cial (2) es correcta. 

Esa multiplicación AC T = (det A)/proporciona de inmediato A -1 . Recuerde que el co¬ 
factor al borrar el renglón i y la columna j de A va en el renglón j y en la columna i de C T . 
Al dividir entre el número det A (¡en caso de no ser cero!) se obtiene A ~ 1 = C T /det A. 

Ejemplo 1 La inversa de una suma de matrices es una matriz en diferencias: 


'1 

1 

r 

, c T 

'1 

-1 

0' 

0 

1 

1 

tiene A = ——- = 

0 

1 

-1 

0 

0 

1 

det A 

0 

0 

1 


El signo menos entra porque los cofactores siempre incluyen a (—1)‘ + L 


2. La solución de Ax = b. La multiplicación x = A l b es justo C T b dividido entre det 
A. Hay una forma conocida de escribir la respuesta (x x ,..., x n ): 


40 Regla de Cramer: Laj-ésima componente d ex— A l b es el cociente 

«ii «12 bi a Xn ' 

xi = - 2 donde B¡ == : '■ '■ '■ tiene b en la columna j. (4) 

j de* A J ■ * • • 


Cl n j Cl n 2 &nn 
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Demostración Bj se desarrolla por cofactores de su columna pésima (que es b). Como los 
cofactores ignoran esa columna, det B¡ es exactamente lay'-ésima componente en el produc¬ 
to C T b: 

det Bj = b¡C¡j + b 2 C 2j + ■ • ■ + b n C n j- 

Al dividir lo anterior entre det A se obtiene Xj. Cada componente de x es un cociente de dos 
determinantes. Este hecho pudo haberse reconocido a partir de la eliminación gaussiana, 
pero no fue así. B 


Efempfo 2 La solución de 

X\ + 3x2 = 0 
2xi -I- 4x2 = 6 

tiene 0 y 6 en la primera columna para x lt y en la segunda columna para x 2 : 


0 

3 


i 

0 


6 

4 -- 18 -a 


2 

6 

6 

1 

3 —2 

x 2 — - 

1 

3 

' ~ -2 

2 

4 


2 

4 



Los denominadores siempre son det A. Para 1000 ecuaciones, la regla de Cramer requiere 
1001 determinantes. Para mi consternación, encontré en un libro titulado Mathematics for 
the Millions que la regla de Cramer era realmente recomendada (y la eliminación se deja¬ 
ba de lado): 

Para tratar con un conjunto que implica cuatro variables u, w, z, primero es necesa¬ 
rio eliminar una de ellas en cada uno de los tres pares con la finalidad de obtener tres 
ecuaciones en tres variables y así proceder para el triple miembro izquierdo para ob¬ 
tener valores para dos de ellas. El lector que haga esto como ejercicio empezará a 
darse cuenta de cuán formidablemente laborioso se convierte el método de elimina¬ 
ción, donde es necesario tratar con más de tres variables. Esta consideración nos in¬ 
vita a explorar la posibilidad de un método más rápido . . . 

¡El “método más rápido” es la regla de Cramer! Si el autor intentaba calcular 1001 de¬ 
terminantes, ¡yo llamaría al libro Mathematics for the Millionairel 

3. El volumen de una caja. La relación entre el determinante y el volumen se vuelve más 
evidente cuando los ángulos son rectos : las aristas son perpendiculares, y la caja es rectangu¬ 
lar. Así, el volumen es el producto de las longitudes de las aristas: volumen = í x l 2 ■ ■ - l n - 
Se desea obtener el mismo ¿ x l 2 - ■ ■ í n a partir de det A, cuando las aristas de esa ca¬ 
ja estén en los renglones de A. Con ángulos rectos, estos renglones son ortogonales y AA T 
es diagonal: 


Caja con ángulos rectos 
Renglones ortogonales 


renglón 1 


renglón n 
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Las í¡ son las longitudes de los renglones (las aristas), y los ceros fuera de la diagonal se 
deben a que los renglones son ortogonales. Usando las reglas del producto y de la traspo¬ 
sición. 

Caso con ángulos rectos í\¿\ • • ■ / 2 = det(AA T ) = (det A)(det A T ) = (det A) 2 . 

La raíz cuadrada de esta ecuación indica que el determinante es igual al volumen. El sig¬ 
no de det A indica si las aristas constituyen un conjunto “derecho” de coordenadas, como 
en el sistema x-y-z de costumbre, o un sistema izquierdo, como y-x-z. 

Si los ángulos no son de 90°, entonces el volumen no es el producto de las longitudes. 
En el plano (véase la figura 4.2), el “volumen” de un paralelogramo es igual a la base l 
multiplicada por la altura h. El vector b — p de longitud h es el segundo renglón b = (a 2t , 
a 22 ), menos su proyección p sobre el primer renglón. La cuestión clave es ésta: Por la re¬ 
gla 5, det A permanece sin cambio cuando un múltiplo del renglón 1 se resta del renglón 2. 
El paralelogramo puede cambiar a un rectángulo, donde ya se ha demostrado que volu¬ 
men = determinante. 

En n dimensiones, se requiere más trabajo para hacer rectangular a cada caja, aunque 
la idea es la misma. El volumen y el determinante permanecen sin cambio si de cada ren¬ 
glón se resta su proyección sobre el espacio generado por los renglones precedentes, dejan¬ 
do un “vector longitud” perpendicular como pb. Este proceso de Gram-Schmidt produce 
renglones ortogonales, con volumen = determinante. Así, la misma desigualdad debe cum¬ 
plirse para los renglones originales. 



Así se completa el vínculo entre los volúmenes y los determinantes, aunque merece la 
pena volver una vez más al caso más simple. Se sabe que 



Estos determinantes proporcionan los volúmenes, o las áreas, ya que se está trabajando en 
dos dimensiones, que se muestran en la figura 4.3. La base y la altura del paralelogramo 
miden uno; de modo que su área también es 1. 


4. Una fórmula para los pivotes. Finalmente ya es posible saber cuándo es posible 
realizar la eliminación sin intercambios de renglones. La observación clave es que los 
k primeros pivotes están determinados completamente por la submatriz A k en la esqui¬ 
na superior izquierda de A. Los renglones y las columnas restantes de A no afectan esta 





Figura 4.3 Las áreas de un cuadrado unitario y de un paralelogramo unitario son iguales a 1. 


esquina del problema: 

La eliminación \ a b 

sobre A incluye la A = c d 

eliminación sobre A 2 g h 


e a b e 

f —*■ 0 (ad — bc)/a ( af—ec)/a 

i J |_£ h ' 


Ciertamente, el primer pivote sólo depende del primer renglón y de la primera columna. El se¬ 
gundo pivote (ad — bc)la, sólo depende de la submatriz esquinada A 2 de 2 por 2. El resto de 
A no entra sino hasta el tercer pivote. En realidad, lo que determina la esquina superior izquier¬ 
da de L no sólo son los pivotes, sino todas las esquinas superiores izquierdas de L, D, y U: 


A = LDU = 


c/a 1 
* * 



b/a 
1 



Lo que se ve en los dos primeros renglones y columnas es exactamente la factorización de 
la submatriz esquinada A 2 . Esta es una regla general si no hay intercambios de renglones: 


4D ; Si _A ■ se f; 
; Ale — LlcDiUí. 

, suyo. 


'U, las esquinas superiores izquierdas cumplen 
ubmatriz. A k experimenta eliminación gaussiana de 


La demostración es ver que esta esquina puede establecerse primero, incluso antes de consi¬ 
derar otras eliminaciones. O bien, se aplican las reglas para la multiplicación por bloques : 

\L k 0 ]\D k 0 ] \V k F] \L k D k V k L k D k F 
[ B CJ [ 0 E\ 0 Gj BD k U k BD k F + CEG ' 

Al comparar la última matriz con A, la esquina L k D k U k coincide con A k , Así, 

det A k = det L k det D k det U k = det D k = did 2 ■ ■ ■ d k . 

El producto de los k primeros pivotes es el determinante de A k . Ésta es la misma regla que 
ya se conoce para toda matriz. Debido a que el determinante de A k ^ x está dado por d x d 2 - 
d k - ,, cada pivote d k puede aislarse como un cociente de determinantes: 

Fórmula para los pivotes - dei ' . ^ . . = . = ¿ k _ ( 5 ) 

det A k ~\ d\d 2 • • • d k —\ 

En el ejemplo anterior, el segundo pivote era exactamente este cociente (ad — bc)/a. 
Es el determinante de A 2 dividido entre el determinante de A,. (Por convencionalismo, det 


rüiriTii 




ü n ; v c r¡ ' 


Al multiplicar entre sí a todos los pivotes "ti 

det Ai det A 2 
d\d 2 ■ ■ ■ d n — ■ — 

det Aq det A i 


íiACiüH AL 
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viduales, se recupera 

det A n det A„ 

- = - = det A. 

detA„-i detAo 


Con base en la ecuación (5) es posible leer finalmente la respuesta de nuestra pregun¬ 
ta original: Todos los elementos pivote son diferentes de cero siempre que todos los nú¬ 
meros det A* sean diferentes de cero : 


4E La eliminación puede completáis-o a ntercamb as de englones (de modo que 
P = l'j A = LU), si y sólo si todas las submatrices principie: A¡, A 2 . . . , A„ son 
no singulares. 


Eso es lo concerniente a los determinantes, excepto por una observación opcional sobre la 
propiedad 2: el cambio de signo sobre los intercambios de renglones. El determinante de 
una matriz permutación P es el único punto cuestionable en la gran fórmula. Independien¬ 
temente de los intercambios particulares en los renglones que vinculan P con /, el número 
de intercambios ¿siempre es par o impar? De ser así, su determinante está bien definido por 
la regla 2, como +1 o — 1. 

Empezando con (3, 2, 1), con un simple intercambio de 3 y 1 podría llegarse al orden 
natural (1, 2, 3). Así sería también con un intercambio de 3 y 2, luego de 3 y 1, y después de 
2 y 1. En ambas secuencias, el número de intercambios es impar. La afirmación es que un nú¬ 
mero par de intercambios jamás puede producir el orden natural, empezando con (3, 2, 1). 

A continuación se proporciona una demostración. Considere cada par de números en 
la permutación, y sea N la cantidad de pares en que primero aparece el número mayor. Cier¬ 
tamente, N = 0 para el orden natural (1, 2, 3). El orden (3, 2, 1) tiene N = 3 porque todos 
los pares (3, 2), (3, 1), y (2, 1) son erróneos. Se demostrará que todo intercambio modifica 
a Npor un número impar. Luego, para llegar a N = 0 (el orden natural) se requiere un nú¬ 
mero de intercambios que tenga la misma característica par o impar que N. 

Cuando se intercambian vecinos, N cambia por +1 o — 1. Cualquier intercambio pue¬ 
de lograrse mediante un número impar de intercambios de vecinos. Esto completa la de¬ 
mostración; un número impar de números impares es impar. Para intercambiar los 
elementos primero y cuarto a continuación, que son 2 y 3, se requieren cinco intercambios 
(un número impar) de vecinos: 

(2, 1, 4, 3) -*• (1, 2, 4, 3) —»■ (1, 4, 2, 3) -> (1, 4, 3, 2) -» (1, 3, 4, 2) -* (3, 1, 4, 2). 


Se requieren l — k intercambios de vecinos para mover el elemento que está en el lugar k 
al lugar l. Luego, l — k — 1 intercambios mueven al elemento que originalmente estaba 
en el sitio i (y que ahora se encuentra en el lugar l — 1) de regreso al lugar k. Debido a 
que (t — k) + (i — k — 1) es impar, se ha completado la demostración. El determinante 
no sólo tiene todas las propiedades antes encontradas, incluso existe. 


U Conjunto de problemas 4,4 

1. Encuentre el determinante y todos los nueve cofactores C¡j de la siguiente matriz trian¬ 
gular: r. 

° 1 2 3 

A = 0 4 0 

_0 0 5 

Escriba C T , y compruebe que AC T = (det A)/. ¿Qué es A -1 ? 
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2. Use ia matriz de cofactores C para invertir las siguientes matrices simétricas: 


2 

-1 

0' 

r 1 

1 

r 

A = -1 

2 

-1 

y 8=1 

2 

2 

0 

-1 

2 

[l 

2 

3 


Encuentre x, y, y z aplicando la regla de Cramer en la ecuación (4): 

x + 4 y — z — 1 

ax + by = 1 

y jc+y+z=0 

ex + dy = 0 

2x + 3z — 0. 

a) Encuentre el determinante cuando un vector x sustituye a la columna y de la identi¬ 
dad (considere x¡ = 0 como un caso por separado): 

1 X[ 

1 • 


si M — 


i entonces det M 


tí) Si Ax = b, demuestre que AM es la matriz B¡ en la ecuación (4), con b en la colum¬ 
na/ 

c) Deduzca la regla de Cramer, tomando determinantes en AM = Bj. 

a) Dibuje el triángulo con vértices A = (2, 2), B — ( — 1, 3), y C — (0, 0). Al conside¬ 
rarlo como la mitad de un paralelogramo, explique por qué su área es igual a 


i r 2 2 

área (ABC) = 2 det ^ . 
tí) Mueva el tercer vértice a C = (1, —4) y justifique la fórmula 


*1 

yi 

1 

= ^ det 

2 

2 

r 

x 2 

yt 

1 

-1 

3 

1 

As 

>3 

1 

2 

1 

-4 

1 


Sugerencia: Al restar el último renglón de cada uno de los demás se obtiene 


2 2 1 
-1 3 1 

1 -4 1 


1 6 0 
-2 7 0 = det 

1 -4 1 


TraceA' = (1,6),6' = (—2,7), C' = (0, 0) y su relación con A, B, C. 

6. Explique en términos de volúmenes por qué det 3A = 3" det A para cualquier matriz 
Aden por n. 

7. Pronostique, y confirme por eliminación, los elementos pivotes de 


2 12 
4 5 0 
2 7 0 


2 1 2 

.8=453 
2 7 0 


8. Encuentre todas las permutaciones impares de los números {1, 2, 3, 4}. Provienen de 
un número impar de intercambios y conduce a det P = — 1. 

9. Suponga que la permutación P lleva (1, 2, 3, 4, 5) a (5, 4, 1, 2, 3). 
a) ¿Qué hace P 2 a (1, 2, 3, 4, 5)? 

tí) ¿Qué hace P~ l a (1, 2, 3, 4, 5)? 
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10. Si P es una permutación impar, explique por qué P 2 es par pero P 1 es impar. 

11. Demuestre que si se mantiene la multiplicación de A por la misma matriz permuta¬ 
ción P, entonces el primer renglón termina por regresar a su sitio original. 

12. Si A es una matriz de 5 por 5 con todos la^l s 1, entonces det A _. Los volú¬ 

menes, la gran fórmula o los pivotes deben proporcionar alguna cota superior para 
el determinante. 

Los problemas 13 al 17 son sobre la regla de Cramer para x = A ~ x b. 


13. 


Resuelva las siguientes ecuaciones lineales, aplicando la regla de Cramer Xj = det 
Bj /det A: 


2xi + 5x2 = 1 
Xi + 4x2 — 2. 


2xi + X2 =1 

b) x 1 + 2 x 2 + X 3 = 0 

X2 + 2x3 = 0. 


14. Use la regla de Cramer para despejar (solamente) y. Sea D el determinante de 3 por 3: 

ax + by + cz — 1 

ax + by = 1 

a) b) dx +ey + fz= 0 

ex + dy = 0. 

gx + hy + iz — 0. 

15. La regla de Cramer falla cuando det A = 0. El ejemplo a) no tiene solución, mientras 
b) tiene una infinidad. ¿Cuáles son los cocientes x¡ — det Bj /det A? 

2xi + 3x2 = I 2x¡ + 3x2 = 1 

a) (rectas paralelas) b) (la misma recta) 

4xi + 6 x 2 = 1 . 4x! -I- 6 x 2 = 2 . 


16. Demostración rápida de la regla de Cramer. El determinante es una función lineal de la 
columna 1. Es cero si dos columnas son iguales. Cuando b = Ax = xia t + x 2 a 2 + 
x 3 a 3 va en la columna 1 para producir B¡, el determinante es 


b a 2 «3 = Xi«i + x 2 a 2 + x¡a 3 a 2 aA =ri a¡ a 2 =X[detA. 


a) ¿Qué fórmula para x t proviene de miembro izquierdo = miembro derecho? 
tí) ¿Qué pasos llevan a la ecuación de en medio? 

17. Si el miembro derecho b es la última columna de A, resuelva el sistema Ax = b de 3 por 
3. Explique cómo cada determinante en la regla de Cramer conduce a su solución x. 

Los problemas 18 a 26 son sobre A -1 = C T /det A. Recuerde trasponer C. 

18. Encuentre A -1 a partir de la fórmula de cofactores C T /det A. Use simetría en el inci¬ 
so b): 


'1 

2 

0 ' 

2 

-1 

°1 

0 

3 

0 

tí) A = -1 

2 

-1 . 

0 

4 

1 

L 0 

-1 

2 J 


19. Si todos los cofactores son cero, ¿cómo se sabe que A no tiene inversa? Si ninguno de 
los cofactores es cero, ¿es seguro que A es invertible? 


20. Encuentre los cofactores de A, y multiplique AC T para encontrar det A: 

'1 1 4 ' 

A = 12 2, 

1 2 5 _ 

Si el elemento de la esquina se cambia de 4 a 100, ¿por qué det A permanece sin cam¬ 
bio? 
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21. Suponga que det A = 1 y que se conocen todos los cofactores. ¿Cómo puede encon¬ 
trarse A? 

22. A partir de la fórmula AC T ~ (det A)/, demuestre que det C = (det A) n ~ 1 . 

23. (Sólo para profesores) Si se conocen todos los 16 cofactores de una matriz invertible 
A de 4 por 4, ¿cómo encontrar Al 

24. Si todos los elementos de A son enteros, y det A = 1 o —1, demuestre que todos los 
elementos de A -1 son enteros. Proporcione un ejemplo de 2 por 2. 

25. L es triangular inferior y 5 es simétrica. Suponga que son invertibles: 

a 0 0 a b d 

L = b c 0 S — b c e . 

d e f d e f 

a) ¿Cuáles son los tres cofactores de L que son cero? Entonces L~ l es triangular infe¬ 
rior. 

b) ¿Cuáles son los tres pares de cofactores de 5 que son iguales? Entonces S~ 1 es si¬ 
métrica. 

26. Para n = 5, la matriz C contiene_cofactores y cada cofactor de 4 por 4 contiene 

_términos y cada término requiere_multiplicaciones. Compare con 5 3 = 125 

para el cálculo de Gauss-Jordan de A -1 . 

Los problemas 27 a 36 son sobre área y volumen por determinantes. 

27. a ) Encuentre el área del paralelogramo con aristas v = (3, 2) y w — (1, 4). 
tí) Encuentre el área del triángulo con lados v, w, y v + w. Dibújelo. 

c) Encuentre el área del triángulo con lados v, w, y w — v. Dibújelo. 

28. Las aristas de una caja van de (0, 0, 0) a (3, 1, 1), (1, 3, 1), y (1, 1, 3). Encuentre su 
volumen y también el área de cada cara del paralelogramo. 

29. a) Los vértices de un triángulo son (2, 1), (3, 4), y (0, 5). ¿Cuál es el área? 

tí) Un nuevo vértice en (—1, 0) lo hace de lobular (cuatro lados). Encuentre el área. 

30. El paralelogramo con lados (2, 1) y (2, 3) tiene la misma área que el paralelogramo 
con lados (2, 2) y (1, 3). Encuentre estas áreas a partir de determinantes de 2 por 2, y 
justifique por qué deben ser iguales. (No puedo verlo en una ilustración. Por favor es¬ 
críbame si usted puede verlo.) 

31. La matriz H de Hadamard tiene renglones ortogonales. ¡La caja es un hipercubo! 

lili 
\ | —- | _ | 

¿Qué es det H = j j = volumen de un hipercubo en R 4 ? 

1-1 1-1 

32. Si las longitudes de las columnas de una matriz de 4 por 4 son L u Lj., L 3 , L 4 , ¿cuál es 
el máximo valor posible para el determinante (con base en el volumen)? Si todos los 
elementos son 1 o — 1, ¿cuáles son esas longitudes y el determinante máximo? 

33. Demuestre con una figura cómo un rectángulo con área x¡y 2 menos un rectángulo con 
área xyyi produce el área x x y 2 — x 2 y í de un paralelogramo. 

34. Cuando los vectores arista a,b,c son perpendiculares, el volumen de la caja es ||a|| por 
||ú|| por ||4 La matriz A T A es . Encuentre det A T A y det A. 
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35. ¿Cuántos vértices tiene un cubo «-dimensional? ¿Cuántas aristas? ¿Cuántas caras n — 1 

dimensionales? El «-cubo cuyas aristas son los renglones de 21 tiene volumen_. 

Una computadora hípercúbica tiene procesadores en paralelo en los vértices, con co¬ 
nexiones a lo largo de las aristas. 

36. El área de un triángulo con vértices (0, 0), (1, 0), (0, 1) es 5. El volumen de la pirámi¬ 
de con cuatro vértices (0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1) es_. ¿Cuál es el volu¬ 

men de la pirámide en R 4 con cinco vértices en (0, 0, 0, 0) y los renglones de /? 

Los problemas 37 a 40 son sobre áreas dA y volúmenes dV, en cálculo. 

37. Las coordenadas polares satisfacen x = r eos 0 y y = r sen 9. El área polar J dr dd in¬ 
cluye a J: 


_ dx/dr dx/86 _ cosí? — rsenú 
dy/dr dy/89 senú reos# 


Las dos columnas son ortogonales. Sus longitudes son_. Así, J =_ . 

38. Las coordenadas esféricas p, </>, 0 proporcionan x = p sen <f> eos 9, y = p sen ó sen 6, 
Z — p eos <f>. Encuentre la matriz jacobiana de 9 derivadas parciales: dx/dp, dx/d<p, 
dx/86 están en el renglón 1. Simplifique su determinante a J = p 2 sen <p. Luego, 
dV = p 2 sen <f> dp d4> d9. 

39. La matriz que relaciona r, 6 con x, y y está en el problema 37. Invierta esa matriz: 

1 _ 8r/8x 8r/8y _ cosú ? _ 9 

J ~ 89/8x 89/8y ? ? 

Es sorprendente que 8r/8x = dx/dr. El producto JJ~ 1 = / proporciona la regla de la 
cadena 

8x _ 8x dr + dx 86 _ 

8x dr dx 89 dx 


40. El área del triángulo con vértices (0, 0), (6, 0), y (1, 4) es_. Cuando se hace rotar 

un ángulo 9 = 60°, el área es_. La matriz rotación tiene 


determinante 


cosú —senú _ 2 • 

sen 9 eos 6 11 


7 


41. Sean P = (1, 0, -1), Q = (1, 1, 1), y R = (2, 2, 1). Escoja S de modo que PQRS sea 
un paralelogramo, y calcule su área. Escoja T, U, V de modo que OPQRSTUV sea una 
caja inclinada, y calcule su volumen. 

42. Suponga que (x, y, z), (1, 1, 0), y (1, 2, 1) están en un plano que pasa por el origen. 
¿Cuál determinante es cero? ¿Qué ecuación proporciona esto para el plano? 

43. Suponga que ( x, y, z ) es una combinación lineal de (2, 3, 1) y (1, 2, 3). ¿Cuál determi¬ 
nante es cero? ¿Qué ecuación proporciona esto para el plano de todas las combinacio¬ 
nes? 


44. Si Ax = (1, 0,..., 0), demuestre que la regla de Cramer proporciona x — primera co¬ 
lumna de A~ ! . 

45. (VISA a AVIS) Esto requiere un número impar de intercambios (IVSA, AVSI, AVIS). 
Cuente los pares de letras en VISA y AVIS que están invertidas en orden alfabético. 
La diferencia debe ser impar. 
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Capítulo Ejercicios de repaso 

4.1 Encuentre los determinantes de 

■ i i i 11 r 2 -i o -r 

1112 -12-10 
1131 y 0-12-1' 

1 4- 1 1 j [-1 0 -1 2_ 

4.2 Si B — M~ 1 AM, ¿por qué es cierto que det B = det A? También demuestre que det 
A~ 1 B = 1. 

4.3 Empezando con A, multiplique su primer renglón por 3 para obtener B , y reste el pri¬ 
mer renglón de B del segundo para obtener C. ¿Cómo está relacionado det C con det 
A? 

4.4 Resuelva 3 u + 2v = 7, 4n + 3v = 11, aplicando la regla de Cramer. 

4.5 Si todos los elementos de A y A -1 son enteros, ¿cómo sabe que ambos determinantes 
son 1 o — 1? Sugerencia: ¿A qué es igual det A multiplicado por det A -1 ? 

4.6 Encuentre todos los cofactores, y la inversa o el espacio nulo, de 

3 5 eos 0 — sen# a b 

6 9 ’ sen# eos 9 ’ y a b 

4SJ ¿Cuál es el volumen del paralelepípedo que tiene cuatro de sus vértices en (0, 0, 0), 
(—1, 2, 2), (2, —1, 2), y (2, 2, 1)? ¿Dónde están los otros cuatro vértices? 

4.8 ¿Cuántos términos hay en el desarrollo de un determinante de 5 por 5, y cuántos de 
éstos es seguro que son cero si a 2l = 0? 

4.9 Si P x es una matriz permutación par y P 2 es impar, a partir de P\ + P 2 — 
P\(Pt T + P? T ) Pj deduzca que det (P, + P 2 ) = 0. 

4.10 Si det A > 0, demuestre que A puede conectarse a / mediante una cadena continua de 
matrices A(r), todas con determinantes positivos. (La ruta directa A(í) = A + t(I — A) 
va de A(0) = AaA(l) = /, pero entretanto A(í) puede ser singular. El problema no es 
tan sencillo, y el autor agradecerá las soluciones que le sean enviadas.) 

4.11 Explique por qué el punto (x, y) está sobre la recta que pasa por (2, 8) y (4, 7), si 

x y 1 

det 2 8 1 =0, o bien x + 2y — 18 = 0. 

4 7 1 

4.12 En analogía con el ejercicio previo, ¿cuál es la ecuación para que (x , y, z) esté sobre 
el plano que pasa por (2, 0, 0), (0, 2, 0) y (0, 0, 4)? Implica un determinante de 4 por 
4. 

4.13 Si los puntos (x, y , z), (2, 1, 0), y (1, 1, 1) están sobre un plano que pasa por el ori¬ 
gen, ¿qué determinante es cero? Los vectores (1,0, — 1), (2, 1, 0), (1, 1, 1), ¿son in¬ 
dependientes? 

4.14 Si todo renglón de A tiene un solo +1, o un solo — 1, o uno de cada uno (y en caso 
contrario es cero), demuestre que det A — lo— 1 o 0. 
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4.15 Si C = j^“ a] y D = [" .entonces CD = —DC produce4ecuacionesAx = 0: 

2a c b 0] f«1 ÍO’ 

b a + d 0 b v _ 0 
c 0 a + d c w ~~ 0 ' 

0 c b 2d \ UJ L° 

a) Demuestre que det A = 0sia + d= : 0. Resuelva para u, v, w, z, los elementos 
de D. 

b) Demuestre que det A = 0 si ad = be (de modo que C es singular). 

En todos los demás casos, CD — —DC sólo es posible con D = matriz cero. 

4.16 El desplazamiento circular permuta (1,2__ ri) en (2, 3,_1). ¿Cuál es la matriz 

permutación correspondiente P, y (dependiendo de ti), cuál es su determinante? 

4.17 Encuentre el determinante de A = eye(5) + ones(5) y si es posible, el de 
eye(n) + ones(n). 
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Capítulo 



Valores característicos y 
vectores característicos 


5.1 INTRODUCCION 

Este capítulo inicia la “segunda parte” del álgebra lineal. La primera mitad concernía a 
Ax = b. El nuevo problema, Ax = Xx, se resolverá simplificando una matriz, haciéndola 
diagonal de ser posible. El paso fundamental es ya no restar un múltiplo de un renglón de 
otro. La eliminación modifica los valores característicos, lo cual no es deseable. 

Los determinantes proporcionan una transición de Ax = b a Ax = Xx. En ambos ca¬ 
sos el determinante lleva a una “solución formal”: para la regla de Cramer para x = A~ l b, 
y para el polinomio det (A — XI.) cuyas raíces son los valores característicos. (Ahora todas 
las matrices son cuadradas; los valores característicos de una matriz rectangular no tienen 
más sentido que su determinante.) El determinante puede usarse realmente si n = 2 o 3. 
Para n grande, el cálculo de X es más difícil que resolver Ax = b. 

El primer paso es comprender la manera en que los valores característicos pueden ser 
de utilidad. Una de las aplicaciones de éstos es en las ecuaciones diferenciales. ¡Aquí se 
supone que el lector no es un experto en ecuaciones diferenciales! Si el lector puede di¬ 
ferenciar x", sen x, y é*, sabe lo suficiente. Como ejemplo específico, considere el par de 
ecuaciones acopladas 


dv 

~dt 

= 4v 

— 5w, 

v = 8 

en t = 0, 

dw 

dt 

— 2v 

— 3w, 

W) = 5 

en t = 0. 


Este es un problema con valor inicial. La incógnita se especifica en el instante t = 0, me¬ 
diante los valores iniciales proporcionados 8 y 5. El problema consiste en encontrar v(t) y 
w(t) para instantes posteriores t > 0. 

Resulta fácil escribir el sistema en forma matricial. Sea u{t) el vector que se descono¬ 
ce, con valor inicial «(0), La matriz de coeficientes es A: 


Vector desconocido 


v(t) t 
w(t) 


Las dos ecuaciones acopladas se convierten en la ecuación vectorial que se busca: 


Forma matricial 


con u = «(0) en t — 0. 


( 2 ) 
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Este es el planteamiento básico del problema. Observe que se trata de una ecuación de pri¬ 
mer orden; no aparecen derivadas de orden superior, y es lineal en las incógnitas. También 
tiene coeficientes constantes', la matriz A es independiente del tiempo. 

¿Cómo se encuentra k(í)? Si en vez de una sola incógnita hubieran dos, sería fácil con¬ 
testar esta pregunta. En lugar de una ecuación escalar se tendría una ecuación vectorial: 

Ecuación simple = au con u = u(0) en t = 0. (3) 


Basta conocer la solución de esta ecuación: 

Exponencial pura u(t) = e a, u( 0). (4) 

En el instante inicial t = 0, u es igual a u( 0) porque e° = 1. La derivada de e a ‘ tiene el fac¬ 
tor requerido a, de modo que du/dt = au. De esta forma se satisfacen tanto la condición 
inicial como la ecuación. 

Observe el comportamiento de u para grandes instantes. La ecuación es inestable si 
a > 0 , neutralmente estable si a = 0, o estable si a < 0; el factor e at tiende al infinito, per¬ 
manece acotado o tiende a cero. Si a fuese un número complejo, a = a + i(3, entonces las 
mismas pruebas podrían aplicarse a la parte real a. La parte compleja produce oscilaciones 
e‘P' = eos j8r + i sen /3f. La disminución o el crecimiento están regidos por el factor e M . 

Tanto para una simple ecuación. Se asumirá un método directo a sistemas, y se busca¬ 
rán soluciones con la misma dependencia exponencial sobre t justo para encontrar en el ca¬ 
so escalar: 

v(t) = e k, y 
w(t) — e u z 


o, en notación vectorial. 


u(t) = e x 'x. 


( 6 ) 


Esta es toda la clave para las ecuaciones diferenciales du/dt = Au: buscar soluciones ex¬ 
ponenciales puras. Al sustituir v = e Xr y w = e x ’z en la ecuación, se encuentra 


Xe u y = 4 e u y — 5e x, z 
Xe k, z = 2e k, y — 3e x, z. 


El factor e kt es común a cada término, por lo que puede eliminarse. Esta cancelación es la 
razón por la cual para ambas incógnitas se supone el mismo exponente A; así se queda con 


Problema de valor característico 


4y ~óz = Xy 
2y - 3z — Xz. 


(7) 


Esta es la ecuación con valor característico. En forma matricial, se trata de Ax = Xx. Pue¬ 
de verla de nuevo si se utiliza u = e^’x: un número e u que crece o disminuye multiplicado 
por un vector fijo x. Al sustituir en duldt = Au se obtiene Xe x ‘x = Ae u x. Al cancelar e xt 
se obtiene 


Ecuación de valor característico 


Ax = Xx, 


( 8 ) 


5.1 Introducción 


Ahora se cuenta con la ecuación fundamental de este capítulo. Implica dos incógnitas, 
A. y x. Se trata de un problema algebraico, ¡por lo que es posible olvidarse de las ecuacio¬ 
nes diferenciales! El número X (lambda) es un valor característico de la matriz A, y el vec¬ 
tor x es el vector característico asociado. Nuestro objetivo es encontrar los valores 
característicos y los vectores característicos, las As y las xs, y utilizarlas. 

Las soluciones de Ax = Ají 

Observe que Ax = Ax es una ecuación no lineal; A multiplica a x. Si fuese posible encon¬ 
trar A, entonces la ecuación para x sería lineal. De hecho, en lugar de Ax podría escribirse 
A/x, y pasar este término al miembro izquierdo: 

(A - A7)x = 0. (9) 

La matriz identidad preserva matrices y preserva rectos a los vectores; la ecuación (A — 
A)x = 0 es más corta, pero está mezclada. Esta es la clave del problema: 

El vector x está en el espacio nulo de A — XI, 

El número A se escoge de modo que A — XI tenga un espacio nulo. 

Por supuesto, toda matriz tiene un espacio nulo. Resultaría ridículo sugerir lo contrario, pe¬ 
ro el lector puede darse cuenta de este asunto. Se busca un vector característico x distinto 
de cero. El vector x = 0 siempre satisface Ax = Ax, aunque resulta inútil para resolver ecua¬ 
ciones diferenciales. El objetivo es construir u(t) sin exponenciales e x ‘x, y se está interesa¬ 
do sólo en aquellos valores particulares X para los que exista un vector característico x 
distinto de cero. Para que sea útil, el espacio nulo de A - XI debe contener vectores dife¬ 
rentes de cero. En breve, A — XI debe ser singular. 

Para el efecto, el determinante proporciona una prueba concluyente. 

5 A .El número A es un valor característico de A si y sólo si A — XI es singular: 

det(A — XI) = 0. '■ (10) 

Esta es la ecuación característica. Cada A está asociada con vectores característicos x: 

(A - XI)x = 0 o bien, ' Ax = Ax. ■ ; V: ) (11) 

En nuestro ejemplo, A se sustituye por XI para hacerla singular: 


Restar XI 


A -XI 


4 - A -5 
2 -3 -A 


Observe que A sólo se resta de la diagonal principal (ya que multiplica a I). 

Determinante |A — A/| = (4 — A)(—3 — A) + 10 o A 2 - A - 2. 


Este es el polinomio característico. Sus raíces, donde el determinante es cero, son los va¬ 
lores característicos. Éstos provienen de la fórmula general para encontrar las raíces de una 
cuadrática, o de la factorización de A 2 — A — 2 = (A + 1)(A — 2). Esto es cero si A = — 1 
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o X — 2, lo cual se confirma con la fórmula general: 


Valores característicos 


l±V9 


-1 y 2. 


Hay dos valores característicos, porque una cuadrática tiene dos raíces. Toda matriz 
de 2 por 2 A — XI tiene a A. 2 (y ninguna otra potencia superior de A.) en su determinante. 

Los valores X = — 1 y A. = 2 llevan a la solución de Ax = Xx o (A — XI)x = 0. Una 
matriz con determinante igual a cero es singular, por lo que en su espacio nulo debe haber 
vectores x diferentes de cero. De hecho, el espacio nulo contiene toda una recta de vecto¬ 
res característicos; ¡es un subespacio! 


M = - 1 : 


(A — X { I)x 


La solución (el primer vector característico) es cualquier múltiplo diferente de cero de x¡: 
Vector característico para X 2 x¡ = [j]. 


El cálculo de X 2 se realiza por separado: 

A.2 := 2' (A — A.2/)jc 


’y] = fo' 

z 0 


El segundo vector característico es cualquier múltiplo diferente de cero de x 2 . 

Vector característico para X 2 x 2 — L • 

Quizá el lector observe que las columnas de A — X¡I proporcionan x 2 , y que las columnas 
de A — X 2 I son múltiplos de x x . Este hecho es especial (y útil) para las matrices de 2 por 2. 

En el caso de 3 por 3, a menudo igualo una componente de x a 1, y resuelvo (A — XI)x 
= 0 para las otras componentes. Por supuesto, si x es un vector característico, entonces 
también lo son Ix y — x. Todos los vectores en el espacio nulo de A —XI (que se conoce 
como espacio característico) cumplen Ax = Xx. En nuestro ejemplo, los espacios caracte¬ 
rísticos son las rectas que pasan por x¡ = (1, 1) y x 2 = (5,2). 

Antes de volver a la aplicación (la ecuación diferencial), se recalcan los pasos para re¬ 
solver Ajc = Xx: 

1. Calcular el determinante de A — XI. Una vez que X se ha restado de la diagonal prin¬ 
cipal, este determinante es un polinomio de grado n. Comienza con (—A.)". 

2. Encontrar las raíces de este polinomio. Las n raíces son los valores característicos 
de A. 

3. Para cada valor característico, resolver la ecuación (A — XI)x = 0. Debido a que el 
determinante es cero, hay otras soluciones distintas de x = 0. Se trata de los vectores 
característicos. 

En la ecuación diferencial, lo anterior produce las soluciones especiales u = e^'x. Se trata 
de las soluciones puramente exponenciales de du/dt = Au. Observe a e~’ y e 2t : 


ti 1 y- — y,2í 


u(t) = e kl ‘x 2 
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Estas dos soluciones especiales proporcionan la solución completa. Pueden multiplicarse 
por números cualesquiera c x y c 2 , y pueden sumarse entre sí. Cuando n, y u 2 satisfacen la 
ecuación lineal du/dt = Au, también lo hace su suma iq + u 2 : 

Solución completa u(t) = Cie k>, xi + c 2 e Xl ‘x 2 (12) 

Este hecho se denomina superposición, y es válido para las ecuaciones diferenciales (ho¬ 
mogéneas y lineales) justo como era valido para ecuaciones matriciales Ax = 0. El espacio 
nulo siempre es un subespacio, y las combinaciones de las soluciones siguen siendo solu¬ 
ciones. 

Ahora se tienen dos parámetros libres c x y c 2 , y es razonable esperar que sea posible 
de modo que cumplan la condición inicial u = «(0) en í = 0: 

Condición inicial c l x l + c 2 x 2 = u(0 ) o bien ] ^ Cl = ? . (13) 

i Z C“2 D 

Las constantes son c { = 3 y c 2 — 1, y la solución de ¡a ecuación original es 

u(t) — 3e~ 1 | + e 2 ‘ ^ • (14) 

Cuando las dos componentes se escriben por separado, se tiene v(0) — 8 y u>(0) = 5: 

Solución „(f) = 3 e ~> + sé 2 ' , w(t) = 3e~‘ + 2e 2 ‘. 

La clave se encontraba en los valores característicos A. y en los vectores característi- ~ 
eos x. Los valores característicos son importantes de suyo, y no sólo son parte de un truco 
para encontrar u. Quizá el ejemplo más conocido es el de los soldados marchando sobre un 
puente.* Tradicionalmente, dejan de marchar y simplemente caminan sobre el puente. Si 
ocurre que caminan a una frecuencia igual a uno de los valores característicos del puente, 
entonces éste comienza a oscilar. (Del mismo modo en que lo hace un columpio infantil; 
pronto se percibe la frecuencia natural de un giro, e igualándola se hace más grande la os¬ 
cilación). Un ingeniero intenta que las frecuencias naturales de su puente o nave espacial 
estén alejadas de las frecuencias del viento o del movimiento del combustible. Y en el otro 
extremo, un corredor de bolsa pasa su vida intentando estar en línea con las frecuencias na¬ 
turales del mercado. Los valores característicos constituyen el rasgo más importante de 
prácticamente cualquier sistema dinámico. 

Resumen y ejemplos 

Para resumir, en esta introducción se ha mostrado cómo Xy x aparecen de forma natural y 
espontánea cuando se resuelve du/dt = Au. Esta ecuación posee soluciones puramente ex¬ 
ponenciales u = e k ‘x\ el valor característico proporciona la razón de crecimiento o disminu¬ 
ción, y el vector característico x se desarrolla a esta razón. Las otras soluciones son mezclas 
de estas soluciones puras, y la mezcla se ajusta para cumplir las condiciones iniciales. 

La ecuación clave era Ax = Xx. La mayor parte de los vectores no satisfacen esta ecua¬ 
ción. Cambian de dirección cuando se multiplican por A, de modo que Ax no es múltiplo 
de x. Esto significa que sólo ciertos números especiales X son valores característicos, y 
sólo ciertos vectores especiales x son vectores característicos. Es posible observar el com- 


’Ejemplo en el que nunca creí, aunque un puente se cayó de esta forma en 1831. 
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portamiento de cada vector característico, y luego combinar estos “modos normales” para 
encontrar la solución. En otras palabras, es posible diagonalizar la matriz subyacente. 

La diagonalización de la sección 5.2 se aplicará a ecuaciones en diferencias, a los nú¬ 
meros de Fibonacci, y a los procesos de Markov, así como a las ecuaciones diferenciales. 
En cada ejemplo se comenzará con el cálculo de los valores característicos y los vectores 
característicos; no existe ningún atajo para evitar esto. Las matrices simétricas son espe¬ 
cialmente fáciles. Las “matrices defectuosas” carecen de un conjunto completo de vecto¬ 
res característicos, por lo que no son diagonalizables. Ciertamente, es necesario analizarlas, 
aunque no se les permitirá su ingreso en el libro. 

Se empieza con ejemplos de matrices especialmente bondadosas. 

Ejemplo 1 Todo resulta evidente cuando A es una matriz diagonalizable: 

A = q ^ tiene Xj =3 con x\ — q , X 2 = 2 con X 2 = 

Sobre cada vector característico, A actúa como un múltiplo de la identidad; Ax, = 3x, y 
Ax 2 = 2x 2 . Otros vectores como x = (1, 5) son mezclas de x,+ 5x 2 de los dos vectores ca¬ 
racterísticos, y cuando A multiplica a x, y x 2 , se obtienen los valores característicos X, = 
3 y X 2 = 2; 

A multiplicada por x¡ + 5x 2 es 3xi + 10x2 = 

Esto es Ax para un vector típico x, no para un vector característico. Sin embargo, la acción 
de A es determinada por sus vectores característicos y valores característicos: 




Ejemplo 2 


¡Los valores característicos de una matriz proyección son 1 o 0! 

ri M fil 

P = \ \ tiene X = 1 con x¡ = , X 2 = 0 con x 2 = 

-2 2-1 *- - 

Cuando x se proyecta sobre sí mismo, se tiene X = 1, y cuando x se proyecta sobre el vec¬ 
tor cero se tiene X = 0. El espacio columna de P está lleno de vectores característicos, así 
como el espacio nulo. Si las dimensiones de estos espacios sonryn-r, respectivamen¬ 
te, entonces X = 1 se repite r veces y X = 0 se repite n - r veces (siempre n Xs ); 



Cuatro valores 
característicos que 
permiten repeticiones 


'1 0 0 0 ' 
0 0 0 0 

F 0 0 0 0 

0 0 0 1 


tiene 


X = 1, 1,0,0. 


No hay nada excepcional sobre X = 0. Así como cualquier otro número, el cero po¬ 
dría o no ser un valor característico. En caso de serlo, entonces sus vectores característicos 
satisfacen Ax = Ox. Así, x está en el espacio nulo de A. Un valor característico cero indica 
que A es singular (no invertible); su determinante es cero. Todas las matrices invertibles 
cumplen X ¥= 0. 


Ejemplo 3 Cuando A es triangular, los valores característicos están sobre la diagonal principal. 

1 -X 4 5 

det(A-X/)= 0 |-X 6 = (1 — X)(| -X)(i -X). 

0 0 \ -X 
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El determinante es justo el producto de los elementos en 2a diagonal. Es cero si X = I, 
X = j o X = j ; los valores característicos ya estaban en la diagonal principal. 

Este ejemplo, donde los valores característicos pueden encontrarse por inspección, 
apunta a otro tema fundamental del capítulo: la transformación de A en una matriz diagonal 
o triangular sin cambiar sus valores característicos. Una vez más se recalca que la factori- 
zación gaussiana A = LU no es adecuada para este propósito. Los valores característicos de 
U pueden ser visibles en la diagonal, pero no son los valores característicos de A. 

Para la mayor parte de las matrices, no hay duda de que el problema de los valores ca¬ 
racterísticos es computacionalmente más difícil que Ax = b. Con sistemas lineales, un nú¬ 
mero finito de pasos de eliminación producía la respuesta exacta en un tiempo finito. (O, 
de manera equivalente, con la regla de Cramer se obtenía una fórmula exacta para la solu¬ 
ción). Ninguna fórmula es capaz de proporcionar los valores característicos, o Galois se re¬ 
volvería en su tumba. Para una matriz de 5 por 5, det (A - XI) implica X 5 . Galois y Abel 
demostraron que no puede haber ninguna fórmula algebraica para encontrar las raíces de 
un polinomio de quinto grado. 

Todo lo que éstos permiten son algunas verificaciones sencillas de sus valores caracte¬ 
rísticos, después que se han calculado, y se mencionan dos buenos: la suma y el producto. 

5B : La suma de los. n valores característicos es igual a la suma de los n elementos 
en la diagonal: 

Traza de A = Xi +•••• + X„ = a n + ■■■ + a nn . (15). 

Además, el producto de. los n valores característicos es igual al determinante de A. 

1 ■ 

La matriz proyección P tiene elementos en la diagonal ;, 5 y valores característicos 1, 0 
Así, j + 5 coincide con 1+0, como debe ser. Así también lo hace el determinante, que es 
0-1=0. Una matriz singular, con determinante cero, tiene uno o más de sus valores ca¬ 
racterísticos igual a cero. 

No debe haber confusión entre los elementos en la diagonal y los valores característicos. 
Para una matriz triangular siempre son iguales, aunque este hecho es excepcional. Normal¬ 
mente los pivotes, los elementos en la diagonal, y los valores característicos son completa¬ 
mente distintos. Y para una matriz de 2 por 2, la traza y el determinante lo dicen todo: 

tiene traza a + d, y determinante ad — be 
det (A — XI) — det a ^ — X 2 — (traza)X + determinante 

C U A 

T , , . traza ± [(traza ) 2 — 4 det ] 1/2 

Los valores característicos son X = --- - —. 

2 

La suma de estos dos Xs es igual a la traza; en el ejercicio 9 se proporciona + = itaza. 
para todas las matrices. 

Eigshow 

Hay un programa de demostración MATLAB (simplemente hay que teclear eigshow), que 
despliega el problema del valor característico para una matriz de 2 por 2. Empieza con el 
vector unitario x = (1, 0). El mouse hace que este vector se desplace alrededor de la circun- 


a b 
c d 
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ferencia unitaria. Al mismo tiempo, la pantalla muestra a Ax, a color y también en movi¬ 
miento. Posiblemente Ax esté enfrente de x. Posiblemente Ax esté detrás de x. Algunas ve¬ 
ces Ax es paralelo a x. En ese instante paralelo, Ax = Ax (dos veces en la segunda figura). 

_ [0.8 0.3' 
y = (0,1) [0.2 0.7 


, 0 . 2 ) 




El valor característico A. es la longitud de Ax, cuando el vector característico unitario 
x es paralelo. Las opciones integradas para A, ilustran tres posibilidades: 0, 1, o 2 para vec¬ 
tores característicos reales. 

1. No hay vectores característicos reales. Ax permanece atrás o adelante de x. Esto sig¬ 
nifica que los valores característicos y los vectores característicos, son complejos, co¬ 
mo lo son para la rotación Q. 

2. Hay sólo una recta de vectores característicos (lo cual es inusual). Las direcciones 
cambiantes Ax y x se encuentran pero no se cortan. Este hecho ocurre para la siguien¬ 
te matriz de 2 por 2. 

3. Hay vectores característicos en dos direcciones independientes. ¡Este hecho es típico! 
Ax corta a x en el primer vector característico x,, y corta en el segundo vector carac¬ 
terístico Xa- 

Suponga que A es singular (de rango 1). Su espacio columna es una recta. El vector 
Ax debe permanecer en esa recta mientras x gira alrededor. Un vector característico x está 
a lo largo de la recta. Otro vector característico aparece cuando Ax 2 = 0. Cero es un valor 
característico de una matriz singular. 

Para estas seis matrices, es posible seguir mentalmente a x y a Ax. ¿Cuántos vectores 
característicos hay, y dónde? ¿Cuándo ocurre que Ax se desplaza en el sentido del movi¬ 
miento de las manecillas del reloj, en vez de hacerlo en sentido contrario a las manecillas 
del reloj con x? 


A = 


Conjunto de problemas 5,1 

1. Encuentre los valores característicos y los vectores característicos de la matriz A = 
[ 2 j- Compruebe que la traza es igual a la suma de los valores característicos, y 
que el determinante es igual a su producto. 

2. Con la misma matriz A, resuelva la ecuación diferencial du/dt = Au, n(0) = 
¿Cuáles son las dos soluciones exponenciales puras? 

3. Si se pasa a A -II, ¿cuáles son los valores característicos y los vectores característi¬ 
cos, y cómo están relacionados con los de A? 

■ 7/ r ~ 6 - 1 ' 


'2 O" 


'2 

0' 


'o r 


' o r 


'i r 


i i' 

0 l . 


0 

-1 


i 0 


-1 0 _ 


i i 


L° iJ 


4. 


7. 


8 . 


9. 


11 . 


Resuelva du/dt — Pu cuando P es una proyección: 
du r 1 
dt 


i 

L 2 


1 1 

2 
1 

2 -1 


u con u(0) 


Parte de u( 0) crece exponencialmente mientras la parte del espacio nulo, permanece 
fija. 

Encuentre los valores característicos y los vectores característicos de 

'3 42] [00 2~ 

A = 0 12 y 5=020 

0 0 oj L 2 0 0 

Compruebe que a . + X 2 + X 3 es igual a la traza y que X t X 2 X 3 es igual al determinante. 

Proporcione un ejemplo para demostrar que los valores característicos pueden cam¬ 
biarse cuando un múltiplo de un renglón se resta de otro. ¿Por qué los pasos de elimi¬ 
nación no modifican un valor característico igual a cero? 

Suponga que X es un valor característico de A, y que x es un vector característico: 
Ax = Ax: 


a) Demuestre que este mismo x es un vector característico de B = A 
tre el valor característico. Esto debe confirmar el ejercicio 3. 


■ 11, y encuen- 


bj Suponga que A. ¥= 0, demuestre que x también es un vector característico de A \ y 
encuentre el valor característico. 

Demuestre que el determinante es igual al producto de los valores característicos, su¬ 
poniendo que el polinomio característico se factoriza como 

det(A - XI) = (A-i - X)(X 2 — X) ■ ■ ■ (X n — X), (16) 

y haciendo una elección inteligente de A.. 

En dos pasos, demuestre que la traza es igual a la suma de los valores característicos. 
Primero, encuentre el coeficiente de (—A.)" -1 en el miembro derecho de la ecuación 
(16). Luego, encuentre todos los términos de 

f«n — X a \2 - • • ai„ 

«21 a 2 2 ~ X - • • a 2 „ 


det (A - XI) = det 


«ni 


«n2 


■A. 


10 . 


que implican a (—A.)" '. ¡Todos provienen de la diagonal principal! Encuentre ese 
coeficiente de (—A.)" -1 , y compare. 

a) Construya matrices de 2 por 2 tales que los valores característicos de A B no sean 
los productos de los valores característicos de A y B, y los valores característicos de 
A + B no sean las sumas de los valores característicos individuales. 

b) Compruebe, no obstante, que la suma de los valores característicos de A + B es 
igual a la suma de todos los valores característicos individuales de A y B, y de ma¬ 
nera semejante para los productos. ¿Por qué es cierto lo anterior? 

Los valores característicos de A son iguales a los valores característicos de A 1 . Esto 

se debe a que det (A — XI) es igual a det (A T — Ai). Lo anterior es cierto porque_ . 

Demuestre con un ejemplo que los vectores característicos de A y A T no son los mis¬ 
mos. 
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12. Encuentre los valores característicos y los vectores característicos de 
A 


T 


'3 4 


a b 


j 

0 2' 

. _ I 

'-3/4 1/2' 

4 — 3 j 

y A = 

b a 


A — 

- 

2 3 J 

y A 1 = 

1/2 0 


13. Si los valores característicos de B son 1, 2, 3, los valores característicos de C son 4, 5, 
6, y los valores característicos de D son 7, 8, 9, ¿cuáles son los valores característicos 

de la matriz de 6 por 6 A = |^ ® £ j ? 

14. Encuentre el rango y todos los cuatro valores característicos de la matriz de ls y la ma¬ 
triz de tablero de ajedrez: 


'1 

1 

1 

f 


'0 

1 

0 

r 

'1 

1 

1 

1 

1 


1 

0 

1 

0 

1 

1 

1 

1 

I 

y C = 

0 

1 

0 

1 

1 

1 

1 

1 

1 


1 

0 

1 

0 

í 


¿Cuáles vectores característicos corresponden a valores característicos diferentes de 
cero? 

15. ¿Cuáles son el rango y los valores característicos cuando A y C en el ejercicio previo 
son de n por n? Recuerde que el valor característico 7 — 0 se repite n — r veces. 

16. Si A es la matriz de 4 por 4 de ls, encuentre los valores característicos y el determi¬ 
nante de A — 

17. Escoja el tercer renglón de la “matriz siguiente” 

'0 1 0 
A = 0 0 1 

de modo que su polinomio característico | A — XI\ sea — X 3 + 4a 2 +57+6. 

18. Suponga que los valores característicos de A son 0, 3, 5, con vectores característicos 
independientes u, v, w. 

a ) Proporcione una base para el espacio nulo y una base para el espacio columna. 
tí) Encuentre una solución particular de Ax = v + w. Encuentre todas las soluciones, 
c) Demuestre que Ax = uno tiene solución. (En caso de tenerla, entonces_es¬ 

taría en el espacio columna.) 

19. Las potencias A k de esta matriz A tienden al límite cuando k-+ o o: 


0.8 0.3 
0.2 0.7 


0.70 0.45 

0.30 0.55 


0.6 0.6 
0.4 0.4 


La matriz A 2 está a mitad del camino entre A y A°°. Explique por qué A 2 = |(A + A°°), 

a partir de los valores característicos y vectores característicos de estas tres matrices. 

20. Encuentre los valores característicos y los vectores característicos de las dos siguien¬ 
tes matrices: 


1 4 

2 3 


A + / 


2 4 
2 4 


A + / tiene los . 
_por 1. 


vectores característicos que A. Sus valores característicos están 
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21. Calcule los valores característicos y los vectores característicos de A y A” 


A 1 tiene los 


. vectores característicos que A. Cuando los valores característicos 


de A son y X 2 , los valores característicos de su inversa son . 


22. Calcule los valores característicos y los vectores característicos de A y A 2 : 
A = 


'-1 

3' 

A ? 

7 

-3* 

2 

0 

y A 2 = 

-2 

6 


A 2 tiene los mismos_que A. Cuando los valores característicos de A son 7j y X 2 , 

los valores característicos de A 2 son_. 

23. a ) Si se sabe que x es un vector característico, la forma de encontrar X es_. 

tí) Si se sabe que X es un valor característico, la forma de encontrar x es_. 


24. ¿Qué se hace a Ax = 7x, para demostrar los incisos á), tí), y cj? 

a) X 2 es un valor característico de A 2 , como en el problema 22. 

b) X~ l es un valor característico de A -1 , como en el problema 21. 

c) X + 1 es un valor característico de A + /, como en el problema 20. 

A partir del vector unitario u — (|, i |, 

1 P = uu r . 

a) Demuestre que Pu = u. Así, u es un vector característico con 7=1. 
tí) Si v es perpendicular a u, demuestre que Pv = vector cero. Así, 7 = 0. 
c) Encuentre tres vectores característicos independientes de P, todos con valor carac¬ 
terístico 7 = 0. 


25, 


), construya la matriz proyección de rango 


26. Resuelva det (Q 
± i sen 9: 


XI) = Ó, aplicando la fórmula cuadrática, para llegar a 7 = eos < 


Q 


eos 9 —sen 9 
sen 9 eos 6 


Resuelva (Q 
- 1 . 


7 f)x 


27. Toda matriz permutación deja sin cambio a x 
dos 7s más para las siguientes permutaciones: 


rota el plano x-y por el ángulo 9. 

0 para encontrar los vectores característicos de Q. Use i 2 = 
(1,1,..., 1). Así, 7 = 1. Encuentre 


( 

'0 

1 

0" 


'0 

0 

r 

p = 

0 

0 

1 

y P = 

0 

1 

0 

1 

1 

0 

0 


1 

0 

0 


28. Si A tiene 7,[ = 4 y X 2 = 5, entonces det(A - XI) = (7 - 4)(7 - 5) = 7 2 - 97 + 20. 
Encuentre tres matrices que cumplan lo siguiente: traza a + d = 9, determinante = 20, 
y 7 = 4, 5. 

29. Se sabe que los valores característicos de una matriz B de 3 por 3 son 0, 1,2. Esta in¬ 
formación es suficiente para encontrar tres de los cuatro incisos siguientes: 

a) el rango de A, 

tí) el determinante de B T B, 
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30. 

31. 


32. 


33. 

34. 


35. 

36. 

37. 

38. 


39. 


40 . 


e) los valores característicos de B T B, y 
d) los valores característicos de (6 + /)“ 

Escoja el segundo renglón de A = j^® i 
A sean 4 y 7. 

Escoja a, b, c, de modo que det (A — XI) 
son —3, 0, 3: 


de modo que los valores característicos de 


A. 3 . Así, los valores característicos 


'0 1 0 
A = 0 0 1 . 

abe 

Construya una matriz M de Markov de 3 por 3: la suma de los elementos positivos de 
cada columna es 1. Si e = (1, 1, 1), compruebe que M r e = e. Por el problema 11, 
X = 1 también es un valor característico de M. Desafío: Una matriz singular M de 
Markov de 3 por 3 con traza \ tiene valores característicos X =_. 

Encuentre tres matrices de 2 por 2 que tengan X¡ = X 2 = 0. La traza es cero y el de¬ 
terminante es cero. La matriz A podría no ser 0, pero compruebe que A 2 = 0. 

La siguiente matriz es singular con rango 1. Encuentre tres As y tres vectores caracte¬ 
rísticos: 

" 1 ] [2 1 2 

A = 2 [2 12]= 4 2 4. 

_1J |_2 1 2_ 

Suponga que Ay B tienen los mismos valores característicos X¡,, X n con los mis¬ 
mos vectores característicos independientes ^. x n . Así, A = B. Razón : Cualquier 

vector x es una combinación c 1 x 1 + • • •+ c„x n . ¿Cuál es Axl ¿Cuál es Bxl 

(Repaso) Encuentre los valores característicos de A, B, y C: 


'1 

2 

3' 

'0 

0 

f 

A = 0 

4 

5 

, B = 0 

2 

0 

0 

0 

6 

3 

0 

0 


Cuando a + b = c + d, demuestre que (1, 1) es un vector característico, y encuentre 
ambos valores característicos: 

a b 

A = ■ , . 

c a 

Cuando P intercambia los renglones 1 y 2 y las columnas 1 y 2, los valores caracterís¬ 
ticos no cambian. Encuentre vectores característicos de A y PAP para A = 11: 


'1 2 

r 

6 

3 

3" 

A = 3 6 

3 

y PAP = 2 

1 

1 

4 8 

4 

_8 

4 

4 


Problema de desafío: ¿ Existe alguna matriz real de 2 por 2 (distinta de /) con A 3 = P. 
Sus valores característicos deben cumplir A 3 = /. Pueden ser e 2 *‘ n y e~ 2n,n . ¿Qué 
traza y qué determinante se obtienen con lo anterior? Construya A. 

Hay seis matrices permutación P de 3 por 3. ¿Cuáles números pueden ser los determi¬ 
nantes de P? ¿Qué números pueden ser los pivotes ? ¿Qué números pueden ser la tra¬ 
za de P? ¿Cuáles cuatro números pueden ser valores, característicos de P? 


U N i V E 




W A CIONAL 

’S.2l Diagonalización de una matriz 


5.2 D !AG0MAÜZACiÓN DE iM ÍÜÁftff¿ 4A 

Se empieza directamente con el cálculo esencial. Es perfectamente sencillo, y se utilizará en 
todas las secciones de este capítulo. Los vectores característicos diagonaliz/m una matriz: 

50 Suponga que la matriz A de n 
. te independientes. Si estos vectores 

entonces S "'Aries una matriz _ - Los valores c _ e c enso¬ 

bre la diagonal de A: 


Diágbiializaeión i 


S~ l AS = A = 


La matriz 5 se denomina “matriz vector característico”, y A se denomina “matriz valor 
característico”, para la cual se utiliza una letra lambda mayúscula, ya que las lambdas mi¬ 
núsculas se usan para designar los valores característicos que están en su diagonal. 

Demostración Los vectores característicos x¡ se escriben en las columnas de S, y AS se 
calcula por columnas: 


= Xix¡ 


Luego, el truco consiste en separar esta última matriz, en un producto SA bastante diferente: 


AjXj X2X2 


Es vital mantener estas matrices en el orden correcto. Si A está antes de S (y no después), 
entonces A, multiplicará los elementos de la primera línea. Deseamos que Ai aparezca en 
la primera columna. Si es así, entonces SA es correcto. Por tanto, 

AS = SA, o bien, S -1 AS = A, o bien, A = SAS~ ; , (2) 

S es invertible, ya que se supuso que sus columnas (los vectores característicos) son inde¬ 
pendientes. Antes de proporcionar ejemplos o aplicaciones es necesario presentar cuatro 
observaciones. ■ 


Observación 1 Si la matriz A no tiene valores característicos repetidos; es decir, que los 
números Aj,. . . , A„ son distintos, entonces los n vectores característicos son automática¬ 
mente independientes (consulte el punto 5D a continuación). En consecuencia, cualquier 
matriz con valores característicos distintos puede diagonalizarse. 

Observación 2 La matriz de diagonalización 5 no es única. Un vector característico x 
puede multiplicarse por una constante y seguir siendo un vector característico. Las colum¬ 
nas de S pueden multiplicarse por constantes cualesquiera diferentes de cero, y producir 
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una nueva matriz de diagonalización 5. Valores característicos repetidos dqja*_aún más li¬ 
bertad en 5. Para el ejemplo trivial A = 1, cualquter 5 logra lo anterior: S W 
diagonal (A es justo Z). Todos los vectores son vectores característicos de la identidad. 


Observación 3 Otras matrices S no producen una A diagonal Suponga que la pn 
columna de S es y. Entonces la primera columna de SA es X t y. Si esto ha * c “ n “ 
la primera columna de AS, que por multiplicación de matnces es Ay "es y debe ser 
un vector característico: Ay = X,y. El orden de los vectores caractensticos en S y de los va¬ 
lores característicos en A es automáticamente el mismo. 

Observación 4 No todas las matrices poseen n vectores característicos linealmente inde- 
p„d™S"e modo que „» .odas tas mdna.s san du, g ,naUvd,Us. El ejempto es^da, 
de una “matriz defectuosa” es 


Sus valores característicos son X, = X 2 = 0, ya que la matriz es triangular con ceros en la 
diagonal: 


det(A — XI) — det 


-X 1 
0 -X 


Todos los vectores característicos de esta A son múltiplos del vector (1,0). 

¿]* = [o]’ ° bien ’ -[si- 

X = 0 es un valor característico doble: su multiplicidad algebraica es 2. Sin embargo la 
multiplicidad geométrica es 1. porque sólo hay un vector característico independiente. No 
es posible construir S. 


A continuación se proporciona una demostración mas directa de que A no esdia^on - 
lizable. Debido a que X, = a 2 = 0, A tendría que ser la matriz cero. Pero si A - S AS, 

1 = 0, entonces se premultiplica por la izquierda por S y se posmultiplica por la derecha 
por S~\ con la finalidad de concluir falsamente que A - 0. No hay mnguna S mvertib e 
Este fracaso de diagonalización no se debe a que X = 0. Proviene del hecho de que X, 

= X 2 : 

3 11 _ 

Valores característicos repetidos A = Q 3 y A = 

Sus valores característicos son 3, 3 y 1, 1. ¡No son singulares! El problema es la falta de 
vectores característicos, que se necesitan para S. Es necesario recalcar estas necesidades. 

La diagonalización de A depende de la existencia de suficientes vectores caracte- 
rísticos. 

La invertibilidad de A d epende de los valores característicos diferentes de cero. 

No hay relación entre la diagonalización (n vectores característicos independientes) y la in¬ 
vertibilidad (valores característicos diferentes de cero). La única indicación proporcionada 
por los valores característicos es: la diagonalización puede fracasar sólo si hay valores ca¬ 
racterísticos repetidos. Incluso así, no siempre fracasa. A = / tiene valores característicos 
repetidos 1, 1,..., 1, ¡aunque ya es diagonal! En este caso no hay carencia de vectores ca 

racterísticos. 
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La prueba consiste en comprobar, para un valor característico que se repite p veces, si 
hay p vectores característicos independientes; en otras palabras, si el rango de A — XI es 
n — p. Para completar este círculo de ideas, es necesario demostrar que valores caracterís¬ 
ticos distintos no constituyen ningún problema. 

SD Si los vectores característicos Xj,. .., x k corresponde avalores característicos 
distintos X x ,... ,X k , entonces estos vectores característicos son linealmenté indepen¬ 
dientes. 

Primero se supone que k = 2, y que con alguna combinación de x¡ y x 2 se obtiene ce¬ 
ro: c l x l + cpc 2 = 0. Al multiplicar por A, se encuentra t^XiXi + c 2 X 2 x 2 = 0. Al restar X 2 
multiplicado por la ecuación previa, el vector x 2 desaparece: 

c 1 (X 1 - X 2 )x¡ = 0. 

Debido a que X, ri X 2 y a que X[ ri 0, se está forzando a que c¡ = 0. De manera semejante, 
c 2 = 0, y los dos vectores son independientes; sólo la combinación trivial proporciona cero. 

Este mismo razonamiento se extiende a cualquier cantidad de vectores característicos: 
si con alguna combinación se obtiene cero, debe multiplicarse por A, restar k k multiplica¬ 
do por la combinación original, y entonces desaparece x k , dejando una combinación de 
Xx,, x k - u con lo cual se obtiene cero. Al repetir los mismos pasos (en realidad, esto es 
inducción matemática) se termina con un múltiplo de x { que produce cero. Así se obliga 
a que c l = 0, y finalmente a que todo c¡ — 0. En consecuencia, los vectores característicos 
que provienen de valores característicos distintos, son automáticamente independientes. 

Una matriz con n valores característicos distintos puede diagonalizarse. Este es el ca¬ 
so típico. 


Ejemplo 1 


Ejemplos de diagonalización 

El punto más importante de esta sección es S~ l AS = A. La matriz vector característico S 
transforma A en su matriz valor característico A (diagonal). Esto se verá a continuación pa¬ 
ra proyecciones y rotaciones. 

La proyección A = f j j tiene matriz valor característico A = ¿ q j . Los vectores 

característicos van en las columnas de S: 



y 


AS = S A = 



La última ecuación puede comprobarse a primera vista. En consecuencia, S 'AS 1 = A. 


Ejemplo 2 Por sí mismos, los valores característicos no resultan tan evidentes para una rotación-. 

rotación de 90° K — \ tiene det (K — XI) = X 2 + 1. 

1 ü 

¿Cómo es posible que un vector rote, y aun así, preserve sin cambio su dirección? Apa¬ 
rentemente, lo anterior no es posible salvo para el vector cero, lo cual es inútil. Sin embar¬ 
go, debe haber valores característicos, y debe ser posible resolver du/dt = Ku. El polinomio 
característico X 2 + 1 debe seguir teniendo dos raíces, aunque no son reales. 

Ahora, el lector puede ver el camino de salida. Los valores característicos de K son 
números imaginarios, X t = i y X 2 = — i. Tampoco ios vectores característicos son reales. 
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De alguna manera, al rotar 90°, se multiplican por i o por —i: 




(K-X 2 I)x 2 = ¡ l . 




Los valores característicos son distintos, aun cuando son imaginarios, y los vectores carac¬ 
terísticos son independientes. Éstos van en las columnas de S: 



y 


S~ l KS 



Se está frente a un hecho ineludible: los números complejos son necesarios incluso 
para matrices reales. Si hay muy pocos valores característicos reales, siempre hay n valo¬ 
res característicos complejos. (Los complejos incluyen a los reales, cuando la parte imagi¬ 
naria es cero). Si hay muy pocos vectores característicos en el mundo real R 3 , o en R", se 
busca en C 3 o en C". El espacio C" contiene a todos los vectores columna con componen¬ 
tes complejas, y posee nuevas definiciones de longitud, producto interno y ortogonalidad. 
Sin embargo, no es más difícil que R n , y en la sección 5.5 se realiza una sencilla conver¬ 
sión al caso complejo. 


i 

f 



Potencias y productos: A k y A B 

Hay una situación adicional en que los cálculos son fáciles. Los valores característicos de 
A 2 son exactamente X 2 ,..., X 2 t , y cada vector característico de A también es un vector 
característico de A 2 . Se empieza con Ax = Xx, y se multiplica de nuevo por A: 

A 2 x = AXx = XAx = X 2 x. (3) 

Por tanto, X 2 es un valor característico de A 2 , con el mismo vector característico x. Si la pri¬ 
mera multiplicación por A deja sin cambio la dirección de x, entonces también lo hace la 
segunda. 

El mismo resultado se obtiene de la diagonalización, al elevar al cuadrado a l AS 
= A: 

Valores característicos de A 2 (S _I AS)(S -1 AS) = A 2 o bien, S~ l A 2 S = A 2 . 

La matriz A 2 es diagonalizada por la misma S, de modo que los vectores característicos per¬ 
manecen sin cambio. Los valores característicos están al cuadrado. Este hecho se cumple 
para cualquier potencia de A: 

5E Los valores característicos de A k son X\,..., X„,~ y cada vector característico de 
A sigue siendo un vector característico de A k . Una vez que S diagonaliza a A, tam¬ 
bién diagonaliza a A k : 

A k = (S-'ASXS' 1 AS) • • • (S -1 AS) = S~'A k S. . (4) 

Cada S~ 1 cancela a una S, excepto por la primera S~ 1 y la última 5. 

Si A es invertible, esta regla también es válida para su inversa (la potencia k = — 1). 
Los valores característicos de A ~ 1 son l/X¿. Este hecho puede verse incluso, sin diagona- 
lizar: 

, 1 

Si Ax — Xx entonces x = XA l x y — x = A l x. 

X 
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Ejemplo 3 


Si K es una rotación de 90°, entonces K 2 es una rotación de 180° (lo cual significa —i) y 
K~ l es una rotación de —90°: 


Los valores característicos de K son i y —i; sus cuadrados son — 1 y — 1; sus recíprocos son 
1/z = —i y l/(—0 = i. Así, K 4 es una rotación completa de 360°: 


y también A 4 


¿ 4 0 

0 (- 0 4 


1 0 ' 

0 1 ‘ 


Para un producto de dos matrices, puede preguntarse sobre los valores característicos 
de A B, aunque no se obtiene una buena respuesta. Es bastante tentador tratar de aplicar el 
mismo razonamiento, esperando demostrar que en general no es cierto. Si X es un valor ca¬ 
racterístico de A y p es un valor característico de B, entonces he aquí la falsa demostración 
de que AB tiene el valor característico, pX: 


Demostración falsa 


Apx = pAx 


El error consiste en suponer que Ay B comparten el mismo vector característico x. En ge¬ 
neral, no es así. Es posible que haya dos matrices con valores característicos cero, mientras 
A B tiene valor característico X = 1: 


0 1 0 0 
0 0 10 


1 0 
0 o • 


Los vectores característicos de estas Ay B son totalmente distintos, lo cual es típico. Por la 
misma razón, en general los valores característicos de A + B no tienen nada que ver con X 

+ p. 

Esta falsa demostración sugiere ser verdadera. Si el vector característico es el mismo 
para Ay B, entonces los valores característicos se multiplican y el valor característico de 
A B es pX. Sin embargo, se tiene algo más importante. Hay una forma fácil de identificar 
cuándo Ay B comparten un conjunto completo de vectores característicos, lo cual plantea 
una cuestión clave en mecánica cuántica: 


5F Las matrices diagonalizables compart 
si y sólo si AB = BA. 


erístico S 


Demostración Si la misma S diagonaliza tanto a A = S Ai S 1 y B — SA 2 S \ puede 
multiplicarse en cualquier orden: 

AB = = SAíAíS” 1 y BA = = SA 2 AiS -1 . 


Debido a que Ai A 2 = A 2 Ai (las matrices diagonales siempre son conmutativas) se tiene 
que AB = BA. 

En la dirección opuesta, suponga que AB = BA. Empezando con Ax = Xx, se tiene 
ABx = BAx = BXx = XBx. 

Así, tanto x como Bx son vectores característicos de A, que comparten el mismo X (o bien, 
Bx — 0). Si por conveniencia se supone que los valores característicos de A son distintos; 
es decir, que todos los espacios característicos son unidimensionales, entonces Bx debe ser 
un múltiplo de x. En otras palabras, x es un vector característico de B, así como de A. La 
demostración con valores característicos repetidos es un poco más larga. ■ 
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El principio de incMumbr, de Beisenberg proviene de las matrices no 
v». col la posición P y la cantidad ó= ~n,»» ^ 

dad de movimiento es simétrica sesgada, y juntas cumplen Y y 

de incertidumbre se concluye directamente de la desigualdad de Schwarz ( Qx) x _ 

11 Qx || || Px ||de la sección 3.2: 

\\ x f =x T x =x r (QP ~ PQ)x <2\\Qx\\\\Px\\. 

El producto de || 2x||/||x|| y \\Px\\/\\x\\ -los errores de posición ye :antid ^® r 
miento, cuando la función de onda es x- es por lo menos 5 . Es imposible que ambos err - 
TLm pequeños, porque al intentar medir la posición de una partícula se modifica su 

CM TfmTsetX e e n r?a A = SAS"*. Esta- factorización es particultnmente idónea para 
tomar potencias de A, y la cuestión se ilustra con el caso más simge: 

LU es inútil cuando se eleva al cuadrado, pero SAS 1 es perfecta. El cuadrado es 5A S 
y los vectores característicos permanecen sin cambio. Trabajar con estos vectores caracte¬ 
rísticos permite resolver ecuaciones en diferencias y ecuaciones diferenciales. 

Consunto de problemas 5.2 

1. Factorice las siguientes matrices en SAS 


2. Encuentre la matriz A cuyos valores característicos son 1 y 4, y cuyos vectores carac¬ 
terísticos son [i] y [i], respectivamente. ( Sugerencia: A = SAS *.) 

3. Encuentre todos los valores característicos y los vectores característicos de 


y escriba dos matrices de diagonalización S distintas. 

Si los elementos diagonales de una matriz triangular superior de 3 por 3 son 1, 2, 7, 
¿cómo puede saberse que la matriz es diagonalizable? ¿Cuál es A? 

De las siguientes matrices, ¿cuál(es) no puede(n) diagonalizarse? 

r 2 — 2 l r 2 Ol . _ [2 0 

A > = [2 — 2 ] Az " L 2 -2j As l 2 2 - ' 

a) Si A 2 = / ¿cuáles son los posibles valores característicos de A? 

b) Si esta matriz A es de 2 por 2, y no es / o -/, encuentre su traza y su determinante. 

c) Si el primer renglón es (3, — 1), ¿cuál es el segundo renglón? 

Si A = 2 ]’ encuentre A 100 , diagonalizando A. 

Suponga que A = uv T es una columna multiplicada por un renglón (una matriz con 
rango 1). 

a) Multiplique A por u, para demostrar que u es un vector característico. ¿Cuál es X ? 

b) ¿Cuáles son los otros valores característicos de A (y por qué)? 

c) Calcule traza (A), a partir de la suma de la diagonal y la suma de los A.s. 


«1*17 3® 
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9. Demuestre por cálculo directo que ABy BA tienen la misma traza cuando 

, T a b] .. o _ r<? rl 


Concluya que AB — BA = / es imposible (excepto en dimensiones infinitas). 

10. Suponga que los valores característicos de A son 1, 2,4. ¿Cuál es la traza de A 2 ? ¿Cuál 
es el determinante de (A~ 1 ) T ? 


11. Si los valores característicos de A son 1, 1,2, ¿de cuáles de las siguientes afirmacio¬ 
nes se tiene la certeza de que son verdaderas? 

Proporcione un razonamiento de por qué sí son verdaderas o un ejemplo si no son ver¬ 
daderas. 

a) A es invertible. 

tí) A es diagonalizable. 

c) A no es diagonalizable. 

12. Suponga que sólo los vectores característicos de A son múltiplos de x = (1, 0, 0). Fal¬ 
so o verdadero: 

a) A no es invertible. 

tí) A tiene un valor característico repetido. 

c) A no es diagonalizable. 

13. Diagonalice la matriz A = ¡ j y encuentre una de sus raíces cuadradas: una ma¬ 

triz tal que R 2 = A. ¿Cuántas raíces cuadradas hay? 

14. Suponga que la matriz vector característico S tiene S T — S~ l . Demuestre que A = 
SAS -1 es simétrica y tiene vectores característicos ortogonales. 


Los problemas 15 a 24 son sobre matrices valor característico, y vector característico. 

15. Factorice las siguientes matrices en A = SAS " 1 : 


. _ 1 2 ,11 
A [O 3J y A [2 2_ ' 

16. Si A = SAS" 1 entonces A 3 = ( )( )( ) y A -1 = ( )( )( ). 


17. Si A tiene A¡ — 2 con vector característico x¡ — J^¿] y X 2 = 5 con *2 ~ [ 1 ], use 
SAS" 1 para encontrar A. Ninguna otra matriz tiene los mismos Xs y xs. 

18. Suponga que A = SAS -1 . ¿Cuál es la matriz valor característico para A + 211 ¿Cuál 

es la matriz vector característico? Compruebe que A + 2/ = ( )( )( ) -1 . 

19. ¿Falso o verdadero? Si las n columnas de S (vectores característicos de A) son inde¬ 
pendientes, entonces 

a) A es invertible. 

b) A es diagonalizable. 

c ) S es invertible. 

d) S es diagonalizable. 

20. Si los vectores característicos de A son las columnas de I, entonces A es una matriz 

_. Si la matriz vector característico S es triangular, entonces S 1 es triangular y 

A es triangular. 



252 


Capítulo 5 Valores característicos y vectores característicos 



Los valores característicos de AS (son iguales a)(no son iguales a) los valores carac¬ 
terísticos de A multiplicados por los valores característicos de B. Los valores caracte¬ 
rísticos de A B (son)(no son) iguales a los valores característicos de SA. 


Los problemas 25 a 28 son sobre la diagonalizabilidad de A. 

25. ¿Falso o verdadero? Si los valores característicos de A son 2, 2, 5, entonces la matriz 
ciertamente es 

a) Invertible. 

b ) Diagonalizable. 

c) No diagonalizable. 

26. Si los valores característicos de A son 1 y 0. escriba todo lo que sepa sobre las matri¬ 
ces A y A 2 . 

27. Complete las siguientes matrices de modo que det A = 25. Así, traza = 10, y ¡X = 5 
es repetido! Encuentre un vector característico con Ax = 5*. Estas matrices no son dia- 
gonalizables porque no hay una segunda línea de vectores característicos. 



28. La matriz A = \\ 3 j no es diagonalizable porque el rango de A - 3/ es_. 

Cambie un elemento para hacer diagonalizable a A. ¿Qué elementos podría cambiar? 

Los problemas 29 a 33 son sobre potencias de matrices. 

29. A k — SA k S~ 1 tiende a la matriz cero cuando k -> co si y sólo si el valor absoluto de 
cada X es menor que . ¿Qué es cierto: A k -*■ 0 o B k -*■ 0? 


A = 


'0.6 0.4' 
0.4 0.6 


y B = 


'0.6 0.9 
0.1 0.6 ‘ 


30. (Recomendado) Encuentre Ay S para diagonalizar A en el problema 29. ¿Cuál es el 
límite de A k cuando k —* 00 ? ¿Cuál es el límite de SA k S~ l ? En las columnas de esta 
matriz limitante, es posible observar el __. 


5.2 Diagonalización de una matriz 


31. Encuentre Ay S para diagonalizar B en^Lproblema 29. ¿Cuál es B lo u 0 para estos u 0 ? 


32. Diagonalice A y calcule SA k S 1 con la finalidad de demostrar esta fórmula para A k : 

. [2 1] . Ak 1 [3* + 1 3* - 1] 

A = tiene A* = - , . . 

_ 1 2J 2 [3 - 1 3 + 1 

33. Diagonalice B y calcule SA k S ~~ 1 con la finalidad de demostrar esta fórmula para B k : 


tiene B k 


3 k 3 k - 2 k 
0 2 k 


Los problemas 34 a 44 son nuevas aplicaciones de A ■= SAS 1 . 

34. Suponga que A = SAS -1 . Tome determinantes para demostrar que A = X¡X 2 • ■ ■ 

X„ = producto de as. Esta rápida demostración sólo funciona cuando A es_. 

35. La traza de S multiplicado por AS -1 es igual a la traza de AS -1 multiplicada por S. 

Así, la traza de una matriz diagonalizable A es igual a la traza de A, que es_. 

36. Si A = SAS -1 , diagonalice la matriz en bloque B = rj ^ |. Encuentre sus matri¬ 
ces valor característico y vector característico. 

37. Considere todas las matrices A de 4 por 4 que son diagonalizadas por la misma matriz 
vector característico fija S. Demuestre que las As constituyen un subespacio (cA y A¡ + 
A 2 tienen esta misma S). ¿Cuál es este subespacio cuando S = /? ¿Cuál es su dimen¬ 
sión? 

38. Suponga que A 2 = A. En el miembro izquierdo A multiplica cada columna de A. ¿Cuál 
de los cuatro subespacios contiene vectores característicos con X = 1? ¿Qué subespa¬ 
cio contiene vectores característicos con X = 0? Con base en las dimensiones de es¬ 
tos subespacios, A tiene un conjunto completo de vectores característicos 
independientes y es posible diagonalizarla. 

39. Suponga que Ar = Ax. Si X = 0, entonces x está en el espacio nulo. Si X rí 0, enton¬ 
ces x está en el espacio columna. Las dimensiones de estos subespacios son (« —r) + 
r = n. Entonces, ¿por qué ninguna matriz cuadrada tiene n vectores característicos li¬ 
nealmente independientes? 

40. Sustituya A = SAS -1 en el producto (A - XiI)(A - X 2 I) ---(A - X n I) , y expli¬ 
que por qué esto produce la matriz cero. Se está sustituyendo la matriz A por el núme¬ 
ro X en el polinomio p(X) — det (A — XI). El teorema de Cayley-Hamilton establece 
que este producto siempre es p(A) = matriz cero, incluso si A no es diagonalizable. 

41. Pruebe el teorema de Cayley-Hamilton en la matriz de Fibonacci A = ¿j. El 

teorema, pronostica que A 2 — A — / = 0, ya que det (A — XI) es X 2 — X — 1. 

42. Si A = b d J, entonces det (A — XI) es (X — a)(X — d). Compruebe la afirmación 
del teorema de Cayley-Hamilton de que (A — al){ A — di) = matriz cero. 

43. Si A = g ®] y AB = BA, demuestre que B = también es diagonal. B tie¬ 
ne los mismos_característicos que A, pero diferentes_característicos. Es¬ 

tas matrices diagonales B constituyen un subespacio bidimensional del espacio de ma- 
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trices. AB — BA — 0 proporciona cuatro ecuaciones para las incógnitas a, b, c, d. En¬ 
cuentre el rango de la matriz de 4 por 4. 

44. Si A es de 5 por 5, entonces AB - BA = matriz cero proporciona 25 ecuaciones pa¬ 
ra los 25 elementos de B. Demuestre que la matriz de 25 por 25 es singular, indican¬ 
do una simple solución B diferente de cero. 

45. Encuentre los valores característicos y los vectores característicos para las dos siguien¬ 
tes matrices A y A°° de Markov. Explique por qué A 100 está próxima a A°°: 


0.6 0.2' 

a OO __ 

'1/3 

1/3' 

0.4 0.8 

y a - 

2/3 

2/3 


5.3 ECUACIONES EN DIFERENCIAS Y POTENCIAS A k 

Las ecuaciones en diferencias u k+l — Au k se mueven hacia adelante en un número finito 
de pasos finitos. Una ecuación diferencial asume una infinidad de pasos infinitesimales, 
aunque ambas teorías permanecen absolutamente en paralelo. Se trata de la misma analo¬ 
gía entre el discreto y el continuo que aparecen una y otra vez en matemáticas. Un buen 
ejemplo es el interés compuesto cuando el paso temporal se hace más corto. 

Suponga que se invierten $1000 al 6% de interés. Si se compone una vez al año, el ca¬ 
pital P se multiplica por 1.06. Esta es una ecuación en diferencias P k+l — AP k = 1.06 P k 
con un paso temporal de un año. Al cabo de 5 años, la P 0 = 1000 original se ha multipli¬ 
cado cinco veces: 

Anual P¡ — (1.06) 5 P 0 que es (1.06) 5 1000 = $1338. 

Ahora suponga que el paso temporal se reduce a un mes. La nueva ecuación en diferencias 
es Pk+¡ — (1+ 0.06/12 )p k . Luego de 5 años, o 60 meses, se tienen $11 más: 

( O \ ^ 

1 + -jy- \ po que es (1.005) 60 1000 = $1349. 


Mensual P 60 = ( l + ~Í2~) 9 ue es (1.005) 60 1000 — $1349. 
El paso siguiente es componer cada día, sobre 5(365) días. Esto es de poca ayuda: 


Composición diaria 


0.06 \ 5 
365" ) 


1000 = $1349.83. 


Finalmente, para mantener activos a sus empleados, los bancos ofrecen composición con¬ 
tinua. El interés se suma a cada instante, y la ecuación en diferencias fracasa. Es de espe¬ 
rar que el tesorero no sepa cálculo (lo cual es todo sobre límites cuando At —> 0). El banco 
puede componer el interés N veces al año, de modo que At = l/N: 


Continuamente 


1 1000 = $1349.87. 


O bien, el banco puede pasar a una ecuación diferencial: el límite de la ecuación en dife¬ 
rencias p k+l = (1 + 0.06A t)p k . Al pasar p k al miembro izquierdo y dividir entre Ai, se ob¬ 
tiene 

De discreto a p k+l - p k _ n „, _ .. . _ d P _ n ,• 


continuo 


: 0.06 pk 


At 

e om, Po- Al cabo de t 


tiende a 


< 0.06p. 


La solución es p(t) = e°' 06l p 0 . Al cabo de t = 5 años, lo anterior nuevamente suma 
$1349.87. El capital sigue siendo finito, aun cuando se componga a cada instante, y la me¬ 
joría sobre la composición diaria es de sólo cuatro centavos. 
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Números de Fibonacci 

El objetivo principal de esta sección es resolver u k+l — Au k . Lo anterior lleva a A* y a po¬ 
tencias de matrices. El segundo ejemplo es la famosa sucesión de Fibonacci : 

Números de Fibonacci 0, 1, 1, 2, 3, 5, 8, 13,... 

Este es el patrón: cada número es la suma de los dos números de Fibonacci previos F s: 

Ecuación de Fibonacci dfit +2 r r*+i + Fk- (2) 

Ésta es la ecuación en diferencias. Aparece en una inmensa variedad de aplicaciones, de 
suyo merece todo un libro. Las hojas crecen siguiendo un patrón en espiral, y en el man¬ 
zano o en el roble se encuentran cinco crecimientos por cada dos vueltas alrededor del ta¬ 
llo. El peral tiene ocho crecimientos por cada tres vueltas, y el sauce es 13:5. Parece que el 
campeón es un girasol cuyas semillas escogen una razón casi increíble de F l2 /F l3 = 
144/233.*' 

¿Cómo es posible encontrar el milésimo término de Fibonacci sin empezar en F 0 = 0 
y F¡ = 1, y trabajar hasta llegar a F 1000 1 El objetivo es resolver la ecuación en diferencias 
F k+2 = F k . Esta ecuación puede reducirse a una ecuación de un paso u k+l =Au lr 

Cada paso multiplica u k = (F Mr F k ) por una matriz A: 


Fk+2 — E k +1 + F k 
F k +\ = F k +1 


se convierte en 


Uk + l 




(3) 


El sistema de un paso u M = Au k e s fácil de resolver. Empieza desde u 0 . Luego de un 
paso se obtiene u x = Au 0 . Luego, u 2 es Au x , que es A 2 u 0 . Cada paso conlleva una multi¬ 
plicación por A, y al cabo de k pasos hay k multiplicaciones: 


La solución de una ecuación en diferencias u k+1 = Au k es u k 


Después de k pasos, u k es una combinación de las n “soluciones puras” A k x. 


"Para estas aplicaciones en botánica, consulte el libro On Growth and Form de D’Arcy Thompson (Cambridge 
University Press, 1942), o la hermosa obra de Peter Stevens, Pattems in Nature (Little, Brown, ¡974). Cientos de 
otras propiedades de los F n han sido publicadas en el Fibonacci Quarterly. Parece que fue Fibonacci quien llevó 
los números arábigos a Europa, alrededor de 1200 d.C. 



El verdadero problema consiste en encontrar alguna forma rápida para calcular el milési¬ 
mo término de Fibonacci. La clave se encuentra en los valores característicos y en los vec¬ 
tores característicos: 


50 Si és posible diagonalizar A, A = SAS l , entoeces A k proviene de A* 
.; u k = A k u 0 = (SAS~ l )(SAS~ l ) • - - (SAS~ l )u 0 = SA k S~ l u 0 . 

Las columnas de S son los vectores característicos de A. Al escribir S~ 1 u 0 = 
lución se convierte en ; 

- r i. ri* i rv.i 
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Estas fórmulas constituyen dos métodos para encontrar la misma solución 
Uk = SA k S~ l u 0 ■■ La primera fórmula reconocía que A k es idéntica con SA k S~~ l , y es po¬ 
sible detenerse ahí. Sin embargo, el segundo método conlleva la analogía con una ecuación 
diferencial: las soluciones puramente exponenciales e k “x¡ son ahora las potencias pu¬ 
ras de Xfx¡. Los vectores característicos x¡ son amplificados por los valores característicos 
X¡. Al combinar estas soluciones especiales para coincidir con u 0 que es de donde pro¬ 
viene c— se recupera la solución correcta u k = SA k S~ t u 0 . 

En cualquier ejemplo específico como el de Fibonacci, el primer paso es encontrar los 

valores característicos: 


A — XI 



tiene det (A — XI) — X 2 — X — 1 


- . 1 + V5 

Dos valores característicos X ¡ = —-— 


y x 2 = 


i - V5 

2 


El segundo renglón de A - XI es (1,— X). Para obtener (A XI)x 0, el vector caracte¬ 
rístico es x — (X, 1). Los primeros números de Fibonacci F 0 = 0 y F, = 1 van en u 0 , y 
S -1 «o = c: 




proporciona c = 


1/(M-X 2 )' 
-1/(Xi - X 2 ) 


1 

71 



Estas son las constantes en u k — C\X\x\ + c 2 X\x 2 .. Ambos vectores característicos r, y 
x 2 tienen por segunda componente a 1. Lo anterior deja F k = C\X k + c 2 X k en la segunda 
componente de u k : 


Números de _ _1_ / 1 + VíA _ / 1 

Fibonacci * ./s 2 J \ 2 / 


Esta es la respuesta que se buscaba. Las fracciones y las raíces cuadradas se ven sorpren¬ 
dentes porque la regla de Fibonacci F k+2 = F k+l + F k debe producir números enteros. De 
alguna manera esa fórmula para F k debe proporcionar un entero. De hecho, como el segun¬ 
do término [(1 - ~/5)/2} k /^/5 siempre es menor que j, sólo debe mover el primer térmi¬ 


no al entero más próximo: 


Fiooo = entero más próximo a 


1 

•v/5 



Este número es enorme, y F 1001 es todavía más grande. Las fracciones se vuelven insigni¬ 
ficantes, y el cociente F 100 i/F 1000 debe estar muy próximo a (1 + V5)/ 2 ** 1.618. Debi¬ 
do a que X\ es insignificante en comparación con X k , el cociente F M /F k tiende a X¡. 

Esta es una ecuación en diferencias típica, que lleva a las potencias de A = jj 0 j. 

Implica V5 porque así lo hacen los valores característicos. Si se escoge una matriz con 
k¡ = 1 y /. 2 = 6, es posible centrarse en la simpleza del cálculo, después que se ha diago- 
nalizado A: 

—4 —5l ll f—1 

A— ,, tiene A. = 1 y 6, con x } = . y x 2 - 7 

10 11 ~~ i I ¿ - 


A k = SA k S 1 es 


' 1 — ll [ 1* 0 ' 

-1 2 J _0 6 * 


"2 ll I" 2 — 6* 1 -6 k 

1 1J [ —2 -f 2 • 6 4 —1 +2-6* ‘ 


Las potencias 6 k y \ k aparecen en la última matriz A k , mezcladas por los vectores caracte¬ 
rísticos. 
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Para la ecuación en diferencias u k+i = Au k , se recalca la cuestión principal. Cada vec¬ 
tor característico x produce una “solución pura” con potencias de X: 



Cuando el u 0 inicial es un vector característico x, esta es la solución: u k = X k x. En ge¬ 
neral, u 0 no es un vector característico. Pero si u 0 es una combinación de vectores caracte¬ 
rísticos, entonces la solución u k es la misma combinación de estas soluciones especiales. 


5B Si «o= ct_x¡ + • - • + c n x ,,, entonces : 

c n X k n x n . Los es se escogen para coincidir con el vector inicial u 0 : 



Matrices de Markov 

En el capítulo 1, hay un ejercicio sobre salir y entrar a California, que merece un análisis 
más detallado. Las reglas eran las siguientes: 

Cada año, -L de la gente que vive fuera de California se cambia a este estado, y ~ de la 
gente que vive en California sale del estado. Se empieza con y 0 gente fuera y Zq dentro. 

Al final del primer año las cantidades fuera y dentro son y Zj: 

Ecuación en = 0.9y 0 + 0.2z 0 ,. [yi] _ Í0.9 0.2l fy 0 " 

diferencias z¡ = 0. ly 0 + 0.8zo ° len ’ z i 0.1 0.8 zo 

Este problema y su matriz poseen las dos propiedades esenciales de un proceso de Mar¬ 
kov: 

1. El número total de gente permanece fijo. La suma de cada columna de la matriz de 
Markov es 1. No se gana ni pierde a nadie. 

2. Los números de gente afuera y dentro jamás pueden volverse negativos: La matriz no 
tiene elementos negativos. Todas las potencias de A k son no negativas.* 

Esta ecuación en diferencias de Markov se resuelve, usando u k = SA k S~ l UQ. Lue¬ 
go se demuestra que la población tiende a un “estado estacionario”. Primero es necesario 

diagonalizar a A: 

A - XI = °'^ n _ ?■“ tiene det (A — A/) = A 2 — 1.7A + 0.7 

M = 1 y = 0.7: A = SAS~ l = ¡ J Q ? J • 


* Además, la historia ha sido relegada por completo; cada nuevo u k+l depende sólo del u k actual. Tal vez incluso 
nuestras vidas son ejemplos de procesos de Markov, aunque espero que no lo sean. 
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Para encontrar A k , y la distribución luego de k años, SAS 1 se cambia por SA k S 



(yo + Zo) i + (yo 


■ 220X0.7/ 



Los dos términos son cik\x¡ + c-iA x t- El factor X* — 1 está escondido en el primer tér¬ 
mino. A largo plazo, el otro factor (0.7/ se vuelve extremadamente pequeño. La solución 
tiende a un estado limitante ^OO (y oo y Zoo)* 


Estado estacionarlo 


= (yo + zo) 

Zoo 



La población total sigue siendo y 0 + Zo, pero en el límite \ de esta población está fuera de 
California y 5 está dentro. ¡Lo anterior es cierto sin importar cuál haya sido la distribución 
inicial! Si el año empieza con § fuera y 5 dentro, entonces termina de la misma forma: 


o bien , Au = u cc . 

El estado estacionario es el vector característico de A correspondiente ak — 1. Multipli¬ 
car por A, de un paso temporal al otro, deja sin cambio a u x . 

La teoría de los procesos de Markov, se ilustra con este ejemplo de California: 




11 

sK • — 


ilM 


c) Los otros valores característicos cumplen jX¡] ^ 1. 

d) Si A o cualquier otra potencia de A tiene a todos sus elementos positivos, es¬ 
tos otros [X ; | están abajo de 1. 

La solución A k u 0 se aproxima a un múltiplo de x,, el cual es el estado esta¬ 
cionario «oo- 


Para encontrar el múltiplo idóneo de X\, se usa el hecho de que la población total permane¬ 
ce igual. Si California empezó con todos sus 90 millones de gente fuera, entonces terminó 
con 60 millones fuera y 30 dentro. Termina de la misma forma si originalmente los 90 mi¬ 
llones están dentro. 

Se observa que muchos autores trasponen la matriz, de modo que la suma de sus ren¬ 
glones es 1 . 


Observación Esta descripción de un proceso de Markov fue determinista: las poblaciones 
se movieron en proporciones fijas. Pero si se considera un simple individuo, las fracciones 
que se mueven se convierten en probabilidades. Un individuo fuera de California entra con 
probabilidad -L a este estado. Si está dentro, la probabilidad de salir es ~¡. El movimiento 
se vuelve un proceso aleatorio, y A se denomina matriz de transición. 

Las componentes de u k = A k u 0 especifican la probabilidad de que el individuo esté fue¬ 
ra o dentro del estado. Estas probabilidades nunca son negativas, y su suma es 1; es decir. 
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todo mundo debe estar en algún sitio. Esto retrotrae las dos propiedades fundamentales de 
una matriz de Markov: La suma de cada columna es 1, y ningún elemento es negativo. 

¿Por qué X = 1 siempre es un valor característico? La suma de cada columna de A — / 
es 1 — 1 = 0. En consecuencia, la suma de los renglones de A — / es el renglón cero, los 
renglones son linealmente dependientes, y det (A — I) = 0. 

Excepto por casos muy especiales, u k tiende al vector característico correspondiente.* 
En la fórmula u k = CtXfx t + • • • + c n X k n x n ningún valor característico puede ser mayor 
que 1. (En caso contrario se inflarían las probabilidades u¿). Si todos los demás valores ca¬ 
racterísticos son estrictamente menores que Xj = 1, entonces el primer término en la fórmu¬ 
la es dominante. Los otros X* se van a cero, y u k -»■ dx¡ = «oo = estado estacionario. 

Este es un ejemplo de uno de los temas torales de este capítulo: Dada información so¬ 
bre A, encontrar información sobre sus valores característicos. Aquí se encontró X máx = 1. 

Estabilidad de u k+t = Au k 

Hay una diferencia evidente entre los números de Fibonacci y los procesos de Markov. Los 
números F k se vuelven cada vez más grandes, mientras la definición de “probabilidad” es¬ 
tá entre 0 y 1. La ecuación de Fibonacci es inestable. También lo es la ecuación del interés 
compuesto P M = 1.0 6P k \ el capital crece por siempre. Si las probabilidades de Markov 
decrecen a cero, esa ecuación sería estable; pero no lo hacen, ya que en cada etapa su su¬ 
ma debe ser 1. En consecuencia, un proceso de Markov es neutralmente estable. 

Se desea estudiar el comportamiento de u k + 1 = Au k cuando k —>- 00 . Suponiendo que 
A puede diagonalizarse, u k es una combinación de soluciones puras: 

Solución en el instante* u k = SA k S~ l u 0 = c\k\x\ + • • • + c„X*x„. 


Ejemplo 1 


El crecimiento de u k está regido por los X* . La estabilidad depende de los valores carac¬ 
terísticos'. 



5J La ecuación en diferí 

estable si todos los valoi 
neutralmente estable si 
inestable si por lo meno 

En el caso estable, las poti 


; ticos 


como u k 


La matriz A es ciertamente estable: 



tiene valores característicos 0 y 1 . 


Los Xs están en la diagonal principal porque A es triangular. Empezando con cualquier u 0 , 
y siguiendo la regla u k+l = Au k , la solución debe terminar por tender a cero: 



*Si todos los que están afuera se mueven hacia dentro y todos los que están adentro se mueven hacia fuera, entonces 
las poblaciones se invierten cada año y no hay estado estacionario. La matriz de transición es A — ¿ J y ” í 

es un valor característico, así como +1, io cual no puede ocurrir si todos los a ¿J > 0. 
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El mayor valor característico A — y rige la disminución; después del primer paso, cada u k 


es lu k - 1 . El verdadero efecto del primer paso, es separar u 0 en los dos vectores caracterís¬ 
ticos de A: 


u o — 



nv 

y entonces u k = 1-1 


+ ( 0 / 



g 

¥ 


Matrices positivas y aplicaciones a la economía 

Al desarrollar las ideas de Markov es posible encontrar una pequeña mina de oro ( comple¬ 
tamente opcional) de aplicaciones matriciales a la economía. 

Ejemplo 2 Matriz entrada-salida de Leontief 

Este es uno de los primeros grandes éxitos de la economía matemática. Para ilustrarlo, se 
construye una matriz consumo, en la que ay proporciona la cantidad del producto j que 
se requiere para obtener una unidad del producto i: 



'0.4 

0 

o.r 

(acero) 

A = 

0 

0.1 

0.8 

(alimentos) 


0.5 

0.7 

0.1 

(trabajo) 


La primera pregunta es: ¿Es posible producir y j unidades de acero, y 2 unidades de alimen¬ 
tos, y y 3 unidades de trabajo? Es necesario empezar con grandes cantidades p x , p 2 , Pz, por¬ 
que una porción se consume en la producción misma. La cantidad que se consume es Ap, 
y deja una producción neta de p — Ap. 

Problema Encontrar un vector p tal que p — Ap = y, o bien, p — (I — A) ‘y. 

Aparentemente sólo se está preguntando si / — A es invertible. Sin embargo, hay un giro 
negativo del problema. La demanda y la producción, y y p, son no negativas. Debido a que 
p es (/ - A) - ‘y, la verdadera pregunta es sobre la matriz que multiplica a y: 

¿Cuándo ocurre que (/ - A ) -1 es una matriz no negativa? 

Aproximadamente, A no puede ser demasiado grande. Si la producción consume demasia¬ 
do, nada queda como salida. La clave radica en el mayor valor característico X¡ de A, que 
debe ser menor que 1 : 

si A-i > 1, (/ - A ) -1 fracasa en ser no negativa, 
si X¡ = 1, (I - A )" 1 fracasa en existir. 

si A¡ < 1, (/ - A ) -1 es una suma convergente de matrices no negativas: 

Serie geométrica (/ — A)~ ! = I + A + A 2 4- A 3 + • • ■. (7) 

En el ejemplo de 3 por 3 se tema X x = 0.9, y la salida excedía a la entrada. La producción 
puede continuar. 

Es fácil demostrar lo anterior, una vez que se conoce el hecho principal sobre una ma¬ 
triz no negativa como A: No sólo el mayor valor característico es positivo, sino que 
también lo es el vector característico x v Así (/ - A)" 1 tiene el mismo vector característi¬ 
co, con valor característico 1/(1 — A-j). 

Si A ¡ excede a 1, ese último número es negativo. La matriz (/ — A ) -1 tomará el vec¬ 
tor positivo x x como si fuese un vector negativo x x /( 1 — X¡). En ese caso (/ — A) 1 defini¬ 
tivamente no es no negativa. Si A, = 1, entonces I - A es singular. El caso productivo es 
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A x < 1, cuando las potencias de A se hacen cero (estabilidad) y la serie infinita I + A + 
A 2 + ... converge. 

Al multiplicar esta serie por I — A se queda con la matriz identidad; todas las poten¬ 
cias superiores se cancelan, de modo que (I — A ) -1 es una suma de matrices no negativas. 
A continuación se proporcionan dos ejemplos: 

ie A[ = 2 y se pierde la economía 

1 

tiene Ai = — y es imposible producir algo. 

En estos casos, las matrices (/—A) -1 son |^2 1 ] y ^ 2 ]- 

La inspiración de Leontief fue encontrar un modelo en que se utilizan datos genuinos 
de la economía real. La tabla para 1958 contenía 83 industrias en Estados Unidos, con una 
“tabla de transacciones” de consumo y producción para cada una. La teoría también llega 
más allá de (/ — A) - " 1 , para decidir precios naturales y cuestiones de optimización. Nor¬ 
malmente, el trabajo está limitado en suministro y debe minimizarse. Y, por supuesto, la 
economía no siempre es lineal. 

Ejemplo 3 Los precios en un modelo entrada-salida cerrado 

El modelo se denomina “cerrado” cuando todo lo que se produce es consumido. Nada sa¬ 
le del sistema. En ese caso, A regresa a ser una matriz de Markov. La suma de las colum¬ 
nas es 1. Podría hablarse sobre el valor del acero, y de los alimentos, y del trabajo, en vez 
del número de unidades. El vector p representa precios, en vez de niveles de producción. 

Suponga que p 0 es un vector de precios. Entonces Ap 0 multiplica los precios por can¬ 
tidades con la finalidad de proporcionar el valor de cada producto. Este es un nuevo con¬ 
junto de precios que el sistema utiliza para el siguiente conjunto de valores A 2 p 0 . La 
pregunta es si los precios tienden al equilibrio. ¿Existen precios tales que p = Ap, y el sis¬ 
tema conduce a ellos? 

p se reconoce como el vector característico (no negativo) de la matriz A de Markov, 
con A = 1. Este es el estado estacionario p x , al que se tiende desde cualquier punto inicial 
p 0 . Al repetir una transacción una y otra vez, los precios tienden al equilibrio. 

El teorema de “Perron-Frobenius” proporciona las propiedades clave de una matriz 
positiva, que no debe confundirse con una matriz positiva definida, que es simétrica y to¬ 
dos sus valores característicos son positivos. Aquí todos los elementos ay son positivos. 

5K Si A es una matriz positiva, también lo es su mayor valor característico: A-, > 
todos los demás |A ¿ [. Cada componente del vector característico x x correspondiente, 

. también es positivo. 

Demostración Suponga A > 0. La idea clave es considerar todos los números f tales que 
Axs: tx para algún vector no negativo x (que no sea x = 0). La desigualdad Ax s tx se de¬ 
ja para contar con muchos candidatos positivos t. Para el mayor valor í máx (que se alcan¬ 
za), se demostrará que la desigualdad se cumple: Ax = f máx x. 

En caso contrario, si Ax £ t míK x no es una igualdad, se multiplica por A. Debido a que 
A es positiva, lo anterior produce una desigualdad estricta A 2 x > t mix Ax. En consecuencia, 
el vector positivo y = Ax cumple Ay > f má *y, y í míx hubiera podido ser más grande. Esta 
contradicción obliga a la igualdad Ax = t mix x, y se tiene un valor característico. Su vector 
característico x es positivo (no solamente no negativo) debido a que en el miembro izquier¬ 
do de esa desigualdad, es seguro que Ax es positivo. 


A = 

A = 


0 2 
2 0 

0.5 2 

0 0.5 
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Para ver que ningún valor característico puede ser mayor que r máx , suponga que Az 
Xz. Debido a que tanto X como z pueden implicar números negativos o complejos, se to¬ 
man valores absolutos: [X||z| = | Az| < A|z| por la “desigualdad del triángulo”. Este |z| 
es un vector no negativo, de modo que |X| es uno de los candidatos posibles t. En conse¬ 
cuencia |A| no puede exceder a X,, que era í máx . * 


Ejemplo 4 Modelo de von Neumann, de una economía en expansión 

Se regresará a la matriz A de 3 por 3 que proporcionó el consumo de combustible, alimen¬ 
tos, y trabajo. Si las salidas son l u entonces las entradas requeridas son 



0.4 


0.1 

0 

0.1 

0.8 

0.5 

0.7 

0.1 



Aiii. 


En economía, ¡la ecuación en diferencias es hacia atrás! En vez de u, = Au 0 , se tiene u 0 = 
Au¡. Si A es pequeña (como es el caso), entonces la producción no consume todo, y la eco¬ 
nomía puede crecer. Los valores característicos de A” 1 rigen este crecimiento. Pero otra 
vez hay un giro no negativo, ya que el acero, los alimentos, y el trabajo no se presentan en 
cantidades negativas. Von Neumann se pregunto por la razón máxima t a la que puede cre¬ 
cer la economía sin dejar de ser no negativa, lo cual significa que u\ > f«o 0. 

Así, el problema requiere u¡ > tAu i. Es como el teorema de Perron-Frobenius, con 
A en el otro lado. Como antes, la igualdad se cumple cuando t alcanza l máx ; que es el valor 
característico asociado con el vector característico positivo de A -1 . En este caso, el factor 
de expansión es : 


x = 5 
5 


0.9 

= 4.5 = 
4.5 


Con acero-alimentos-trabajo, en la razón 1 - 5-5, la economía crece tan rápido como es 
posible: La razón de crecimiento máxima es 1A X . 


H Conjunto de problemas 5.3 

1. Demuestre que cada tercer número de Fibonacci en 0, 1, 1, 2, 3, ... es par. 

2. Bemadelli estudió un escarabajo que “sólo vive tres años, y se reproduce en su tercer 
año”. Estos escarabajos sobreviven el tercer año con probabilidad §, y el segundo con 
probabilidad ¿, y luego producen seis hembras al final de su vida: 

'0 0 6' 

Matriz escarabajo A = 5 0 0. 

0 | 0 


Demuestre que A 3 = I, y siga la distribución de 3000 escarabajos durante seis años. 

3. Para la matriz de Fibonacci A = jj J ], calcule A 2 , A 3 , A 4 , Luego, use el texto y una 
calculadora, para encontrar F 20 - 
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4. Suponga que cada número de “Gibonacci” G k+2 es el promedio de los dos números 
previos, G k+Í y G k . Entonces G k + 2 = \{G k+l + G k ): 

Gk+2 — jGt + i + 2^ k Gk+2 _ . G i+1 

G/c+i — G*+i G* +1 _ _ _ G k 

a) Encuentre los valores característicos y los vectores característicos de A. 

b) Encuentre el límite cuando n -*co de las matrices A" = SA"S~ l . 

c) Si G 0 = 0 y G, = 1, demuestre que los números de Gibonacci tienden a f. 

5. Diagonalice la matriz de Fibonacci completando S ~ l : 

11 X j A, 2 X¡ 0 

i °j L 1 1 j [ 0 ^2j L 

Realice la multiplicación SA k S~ 1 [ ¿ 1 para encontrar su segunda componente. Este es 


el Pésimo número de Fibonacci F k = (X* — X|) /(A i — X 2 ). 

6. Los números X* y X| cumplen la regla de Fibonacci F k +2 — F k +i + F k : 


X\ +2 = Xf +1 + X* y X\ 41 = X| +1 + X\. 

Demuestre lo anterior, usando la ecuación original para los Xs (multiplíquela por X*). 
Entonces, cualquier combinación de X\ y X\ cumple la regla. La combinación 
Fk = (X* — X|) / (A x - X 2 ) proporciona el inicio correcto de F 0 = 0 y F¡ = 1. 

7. Lucas empezó con L 0 = 2 y L, = 1. La regla L k+1 = L k+l + L k es la misma, de mo¬ 
do que A sigue siendo una matriz de Fibonacci. Sume sus vectores característicos 
x t + x 2 \ 


A.t X 2 

1 1 


5(l+^5) + 10 -V5) 


Al multiplicar por A*, la segunda componente es L k = X* + X 2 . Calcule el número 
de Lucas L J0 , lentamente aplicando L k + 2 = L k+l 4- L k , y calcule aproximadamente 
con A.¡°. 

8. Suponga que hay una epidemia en la cual, cada mes la mitad de los sanos enferman y 
la cuarta parte de los enfermos fallecen. Encuentre el estado estacionario para el pro¬ 
ceso de Markov, correspondiente 


L^-hJ L° 0 IJ L W *J 

9. Escriba la matriz de transición de 3 por 3 para un curso de química que se enseña en 
dos secciones, si cada semana \ de los de la sección A y | de los de la sección B aban¬ 
donan el curso, y g de cada sección se cambia a la otra sección. 

10. Encuentre los valores limitantes de y k y z k (k -> oo) si 

y k +i = 0.8 y k + 03zk yo = 0 

Zk+i = 0.2 y k + O.lzk z o = 5. 

También, encuentre fórmulas para y* y z k , a partir de A k = SA k S~~ x ■ 
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a) A partir del hecho de que columna 1 + columna 2 = 2(columna 3), de modo que 
las columnas son linealmente independientes, encuentre un valor característico y un 
vector característico de A: 


0.2 

0.4 

0.3 

0.4 

0.2 

0.3 

0.4 

0.4 

0.4 


b ) Encuentre los otros valores característicos de A (es una matriz de Markov). 

c ) Si u 0 = (0, 10, 0), encuentre el límite de A k u 0 cuando k —>■ o o, 

12. Suponga que hay tres centros principales para los camiones Muévalo-Usted-Mismo. 
Cada mes, la mitad de los camiones que están en Boston y en Los Ángeles, van a Chi¬ 
cago, la otra mitad se queda donde están, y los camiones en Chicago se dividen equi¬ 
tativamente entre Boston y Los Ángeles. Escriba la matriz de transición A de 3 por 3, 
y encuentre el estado estacionario correspondiente al valor característico X = 1. 


13. a ) ¿En qué rango de ay b está la siguiente ecuación de un proceso de Markov? 

_ [ a 1 _fl 

Uk +1 — Au k — j _ j _ , Uk, Uq — j . 


b) Calcule u k = SA k S~ l uo para cualesquiera ay b. 

c) ¿En qué condición sobre a y b, u k tiende a un límite finito cuando k ■ 
es el límite? ¿A debe ser una matriz de Markov? 


oo y cuál 


14. Empresas multinacionales en América, Asia y Europa poseen bienes por $4 trillones. 
Al principio, $2 trillones están en América y $2 trillones están en Europa. Cada año, 
| del dinero en América se queda en ese continente, y j se va a Asia y Europa. Para 
Asia y Europa, [ permanece ahí y ~ se envía a América. 

a) Encuentre la matriz que proporciona 


América 


América 

Asia 

= A 

Asia 

Europa 

año k+l 

Europa 


b) Encuentre los valores característicos y los vectores característicos de A. 

c) Encuentre la distribución limitante de los $4 trillones, cuando se acaba el mundo. 

d) Encuentre la distribución de los $4 trillones en el año k. 

15. Si A es una matriz de Markov, demuestre que la suma de las componentes de Ajc es 
igual a la suma de las componentes de x. Deduzca que si Ax = Aje con X i, enton¬ 
ces la suma de las componentes del vector característico es igual a cero. 

16. La solución de dul dt = Au = ¿J (valores característicos i y —i) gira alrede¬ 
dor de un círculo: u = (eos t, sen í). Suponga que du/dt se aproxima por diferencias 
hacia adelante, hacia atrás, y centradas F, B, C: 


(F) u n +i — u n — Au„ o u n +1 = (/ + A)u„ (este es el método de Euler). 

(B) u n +1 — u n = Am„+i o u „+1 = (I — A)~ l u n (hacia atrás Euler). 

(C) u n +1 ~ u n = |A(«„ + ¡ + u n ) o w„ +1 = (/ - |A) 1 (/ + | Á)u„. 

Encuentre los valores característicos de/ + A, (/ — A) -1 ,e(/ — §A) 1 (/ + |A). 
¿Para cuál ecuación en diferencias la solución u n permanece en un círculo? 
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17. ¿Qué valores de a producen inestabilidad en v„+¡ = a(v n + w n ), w n+¡ = a(v n + w n ) ? 

18. Encuentre los a, b, c más grandes, para los cuales las siguientes matrices son estables 
o neutralmente estables: 

a -0.8] b 0.8] f c 0.8' 

0.8 0.2J ’ [0 0.2J ’ [0.2 c ' 

19. Multiplique término a término para comprobar que (/ — A)( I+ A+A 2 + ■■■) = !■ 
Esta serie representa (I — A) -1 . Es no negativa cuando A es no negativa, en el supues¬ 
to de que tenga una suma finita; la condición para esto es X máK < 1. Sume la serie in¬ 
finita, y confirme que es igual a (/ — A) -1 , para la matriz de consumo 

"0 1 r 

A = 0 0 1 que tiene X m ¿ K = 0. 

0 0 °_ 

20. Para A = [o o!s] > encuentre las potencias A* (incluyendo A°), y demuestre explícita¬ 

mente que su suma coincide con (/ — A) -1 . 

21. Explique por matemáticas o economía por qué al incrementar la “matriz de consumo” 
A debe incrementarse í m4x = X¡ (y aminorar el desarrollo). 

22. ¿Cuáles son los límites cuando k->o o (los estados estacionarios) de lo siguiente? 


0.4 0.2 
0.6 0.8 


0.4 0.2 
0.6 0.8 


‘0.4 0.2 

0.6 0.8 


Los problemas 23 a 29 son sobre A = S AS 1 y A k = SA k S *. 

23. Diagonalice A y calcule SA k S~ l con la finalidad de demostrar esta fórmula para A*: 

„ [3 2] . Ak 1 f5* + 1 5* - 1' 

A tiene A 2 5 * — ! 5* + i ‘ 

24. Diagonalice B y calcule SA k S~ l con la finalidad de demostrar esta fórmula para B k : 

„ f3 11 . f 3* 3* —2*1 


25. Los valores característicos de A son 1 y 9, y los valores característicos de B son — 1 y 

* * = íl y »-íí íl. 


Encuentre una matriz raíz cuadrada de A, a partir de R = sVA S~ l ■ ¿Por qué para B 
no existe ninguna matriz raíz cuadrada real? 

26. Si A y B tienen los mismos as con el mismo conjunto completo de vectores caracte¬ 
rísticos independientes, su factorización en_es la misma. Así, A = B. 

27. Suponga que AyB tienen el mismo conjunto completo de vectores característicos, de 
modo que A = SA I S“ i y B = SA 2 S~ l . Demuestre que AB = BA. 

28. a) ¿Cuándo ocurre, que los vectores característicos para X = 0 generan el espacio nu¬ 

lo N{A)1 

b) ¿Cuándo ocurre, que todos vectores característicos para X 0 generan el espacio 
columna C(A)? 




Capítulo 5 Valores característicos y vectores característicos 


29. Las potencias de A k tienden a cero si todos los |X¡| < 1, y se inflan si cualquier |Á,-[ > 
1. Peter Lax proporciona cuatro ejemplos sorprendentes en su libro Linear Algebra. 

. í 3 2i „ r 3 21 „ _ r 5 7i „ _ r 5 6.91 


Encuentre los valores característicos X = e ,e de B y C, para demostrar que B 4 = I y 
que C 3 = —7. 


5.4 ECUACIONES DIFERENCIALES Y e* 1 

Siempre que se encuentra un sistema de ecuaciones, más que una sola ecuación, la teoría de 
matrices tiene un papel que desempeñar. Para ecuaciones en diferencias, la solución u k = 
A k u 0 dependía de las potencias de A. Para ecuaciones diferenciales, la solución u(t) = 
e A, u( 0) depende de la exponencial de A. Para definir esta exponencial, y comprenderla, de 
inmediato se presenta un ejemplo: 

Ecuación diferencial ^ = Au = 7 1 u. (1) 

dt í 

El primer paso siempre consiste en encontrar los valores característicos (— 1 y —3), así co¬ 
mo los vectores característicos: 

A ¡ =(-l) \ y A = (—3) . 

Luego, varios métodos llevan a u(t). Quizá lo mejor sea hacer coincidir la solución gene¬ 
ral con el vector inicial u{ 0) en t = 0. 

La solución general es una combinación de soluciones exponenciales puras. Estas son 
soluciones de la forma especial ce X! x , donde A. es un valor característico de A, y x es su 
vector característico. Estas soluciones puras satisfacen la ecuación diferencial, ya que 
d/dt(ce x ‘x) = A(ce x, x). (Fueron la introducción a los valores característicos al inicio 
del capítulo). En este ejemplo de 2 por 2, hay dos exponenciales puras a combinar: 


Solución u(t) —c ie Xl 'xi + c 2 e X2t x 2 o bien, u = — lj [ e~ 3 ‘\ 1 

En el instante cero, cuando las exponenciales son e° = 1, n(0) determina c 1 y c 2 : 


Condición inicial 


CiJCi + c 2 x 2 


Se reconoce S, la matriz de vectores característicos. Las constantes c = S , ~ 1 w(0) son las 
mismas que para las ecuaciones en diferencias. Al sustituirlas de nuevo en la ecuación (2), 
se encuentra que la solución es 

«(') = [! _¡1 ^ lfcl -*[•-* .-*1 s ~ l “ W • ( 3 > 


He aquí la fórmula fundamental de esta sección : Se At S l u( 0) resuelve la ecuación dife¬ 
rencial, justo como SA k S~ l u 0 resolvía la ecuación en diferencias: 

u(t ) = Se Al S~ l u(0) con A = í 1 | y e Ac = \ e _ 3l |. (4) 


u ¡í s v u í r- a t c w -o logic a n acío n a l 
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Hay dos cosas mái'qüélíacér con' éWé'‘<fj , é¿tifíft>. Una es completar el procedimiento 
matemático, proporcionando una definición directa de la exponencial de una matriz. La 
otra es proporcionar una interpretación física de la ecuación y su solución. Se trata del ti¬ 
po de ecuación diferencial que tiene aplicaciones de utilidad. 

La exponencial de una matriz diagonal A es fácil: e Al tiene justo los n números e u 
en la diagonal. Para una matriz general A, la idea natural es imitar la serie de potencias 
e x = 1 + x + x 2 /2\ + x 3 /3 ! + • • • . Si se sustituye x por At y 1 por /, esta suma es una 
matriz de n por n: 

_-Ar _ r I , (Ai) 2 , {At? , 


Matriz exponencial 


I + At + 


At? (At? 

- T* -- -+-*•* 

2! 3! 


La serie siempre es convergente, y su suma e At tiene las propiedades idóneas: 

, A e., Át. At , At. , —At. . ti . a r . .A, 


(e AS )(e M ) 


(■ e M )(e ~ M ) 


A partir de la última expresión, u(t) = e At u( 0) resuelve la ecuación diferencial. Esta solu¬ 
ción debe serla misma que la forma Se A, S~ l u( 0) empleada para computación. Para demos¬ 
trar directamente que estas soluciones coinciden, recuerde que cada potencia (SAS~ l ) k se 
traduce en A k = SA k S~ l (debido a que S~ l cancela a S ). Toda la exponencial es diagonali- 
zada por S: 


= /+ SAS l í + 


SA 2 S~ l t 2 SA^S-f 3 


(At? (At? 

= H / + Aí + V + V + -- 


Ejemplo 1 En la ecuación (1), la exponencial de A 


tiene A 


’-i ] 

—3 * 



En í = 0, se obtiene e° = I. La serie infinita <?' proporciona la respuesta para toda f, aun¬ 
que es difícil calcular una serie. La forma Se At S~ l proporciona la misma respuesta cuan¬ 
do es posible diagonalizar a A: se requieren n vectores característicos independientes en 5. 
Esta forma más sencilla, lleva a una combinación de n exponenciales e Xl x, que es la mejor 
solución de todas: 



ctón 


Las columnas de S son los vectores 
obtiene 


combinación de e Xl x 


Las constantes c¡ que cumplen las condiciones iniciales u( 0) son c — S l u( 0). 
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Lo anterior proporciona una analogía completa con las ecuaciones en diferencias y 
SAS~hio- En ambos casos se supuso que era posible diagonalizar a A, ya que en caso con¬ 
trario posee menos de n vectores característicos y no se han encontrado suficientes solucio¬ 
nes especiales. Las soluciones que faltan existen, aunque son más complicadas que las 
exponenciales puras e x ‘x. Implican “vectores característicos generalizados” y factores co¬ 
mo te Xt . (Para calcular este caso defectuoso, puede usarse la forma de Jordán que se mues¬ 
tra en el apéndice B, y encontrar e Jt ). La fórmula u(t) = e A ‘u(0) sigue siendo com¬ 
pletamente correcta. 

La matriz nunca es singular. Una demostración consiste en considerar sus valo¬ 
res característicos; si A es un valor característico de A, entonces e x ‘ es el valor característi¬ 
co correspondiente de trí 4 ', y e Xt jamás puede ser cero. Otro método es calcular el 
determinante de la exponencial: 

dete' 4 ' = e x,l e' 2 ‘ ■ ■ - e x "‘ = e traza(A ' ) . (9) 

Demostración rápida de que ef‘ es invertible: Simplemente reconozca e~ A ‘ como su in¬ 
versa. 

Esta invertibilidad es fundamental para las ecuaciones diferenciales. Si n soluciones 
son linealmente independientes en í = 0, son linealmente independientes por siempre. Si 
los vectores iniciales son v u ... ,v n , entonces las soluciones e A, v pueden escribirse en una 
matriz: 

[e A, vi ■■■ e A ‘v n ] = e Ar [v x ■■■ u„]. 

El determinante del miembro izquierdo es el wronskiano. Éste nunca es cero, ya que es el 
producto de dos determinantes diferentes de cero. Las dos matrices en el miembro derecho 
son invertibles. 

Observación No todas las ecuaciones diferenciales se presentan como un sistema de pri¬ 
mer orden du/dt — Au. Es posible empezar, a partir de una simple ecuación de orden supe¬ 
rior, como y'" — 3y" + 2 y' = 0 . Para convertir lo anterior en un sistema de 3 por 3, se 
introducen v = y' y w = v’ como incógnitas adicionales, junto con y misma. Luego, estas 
dos ecuaciones se combinan con la original para obtener u' = Au: 


y' 

— V 

’o 

1 

0' 

V 

v' 

= w 

o bien, u' — 0 

0 

1 

v = Au 

w f 

= 3w — 2v 

0 

-2 

3j ju/J 


De nuevo, se ha regresado a un sistema de primer orden. El problema puede resolverse 
de dos formas. En un curso de ecuaciones diferenciales, y = e x ‘ se sustituiría por 
y'" - 3 y" + 2 / = 0 : 

(A. 3 - 3A 2 + 2\)e x ‘ =0 o bien, k(k - 1)(A - 2)e x ' = 0. (10) 

Las tres soluciones exponenciales puras son y = e 0 ’, y = e c ,y y = e 2t . No está implicado 
ningún vector característico. En un curso de álgebra lineal, se encuentran los valores carac¬ 
terísticos de A: 

'-X 1 0 ‘ 

det(A — XI) = 0 —X 1 = -A 3 + 3A 2 -2X = 0. (11) 

0 -2 3 — A_ 

¡Las ecuaciones (10)y(ll) son las mismas! Aparecen los mismos tres exponentes: A = 0, 
A = 1, y A = 2. Esta es una regla general que hace consistentes a los dos métodos; las ra¬ 
zones de crecimiento de las soluciones permanecieron fijas cuando las ecuaciones cambia¬ 
ron de forma. Nos parece que resolver la ecuación de tercer orden es más rápido. 
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La importancia física de dul dt = | \ es fácil de explicar, y al mismo tiempo 
; realmente importante. Esta ecuación diferencial describe un proceso de difusión. 



concentración 0 


So Si S 2 S 3 

Figura 5.1 Modelo de difusión entre cuatro segmentos. 

Divida un tubo infinito en cuatro segmentos (véase la figura 5.1). En el instante t = 0, los 
segmentos de en medio contienen concentraciones v(0) y w(0) de un producto químico. En 
cada instante t, la razón de difusión entre dos segmentos adyacentes es la diferencia en 
concentraciones. Dentro de cada segmento, la concentración permanece uniforme (cero en 
los segmentos infinitos). El proceso es continuo en el tiempo pero discreto en el espacio; 
las incógnitas son v(t) y w(t) en los dos segmentos interiores y S 2 . 

La concentración v(t) en 5j cambia de dos formas. Hay una difusión hacia S 0 , y hacia 
o fuera de S 2 - La razón de cambio neta es dv/dt, y dw/dt es semejante: 


Caudal hacia Sj 


■ v) + (0 ■ 


Caudal hacia S 2 


= (0 — w) + {v — w). 


Esta ley de difusión coincide exactamente con nuestro ejemplo du/dt = Au: 

vi du í—2v + u)] [—2 1 

u>J dt [ v — 2w J [1—2 

Los valores característicos —1 y —3 rigen la solución, y proporcionan la razón de que se 
desintegra la concentración, y Ai es el más importante porque sólo un conjunto excepcio¬ 
nal de condiciones puede conducir a “superdesintegración” a la razón e -3 '. De hecho, es¬ 
tas condiciones deben provenir del vector característico (1, —1). Si el experimento sólo 
admite concentraciones no negativas, es imposible y la razón limitante debe ser e~'. La so¬ 
lución que se desintegra a esta razón más lenta, corresponde al vector característico (1, 1). 
En consecuencia, las dos concentraciones se vuelven casi iguales (lo cual es típico de la di¬ 
fusión) cuando f -* oo. 

Un comentario adicional sobre este ejemplo: Se trata de una aproximación discreta, con 
sólo dos incógnitas, para la difusión continua descrita por esta ecuación diferencial parcial: 

, 3“ 3 2 “ 

Ecuación del calor — = —■?. 


Esa ecuación del calor es aproximada, al dividir el tubo en segmentos cada vez más peque¬ 
ños, de longitud UN. El sistema discreto con N incógnitas está regido por 



U\ 


d 



dt 




un _ 
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Esta es la matriz en diferencias finitas con el patrón 1, -2, 1. El miembro derecho de Au 
tiende a la segunda derivada d 2 u/(hr-, luego que un factor de escala N 2 se presenta del pro¬ 
blema de flujo. En el límite cuando N -» oo, se llega a la ecuación del calor du/d t = 
d 2 u/d x 2 . Sus soluciones siguen siendo combinaciones de exponenciales puras, aunque 
ahora hay una infinidad. En vez de vectores característicos de Ax = Xx, se tienen funcio¬ 
nes características de d 2 u/ dx 2 = Xu. Éstas son u{x) — sen nirx con X = —n 2 ?/ 2 . Así, la 
solución de la ecuación del calor es 

OO 

u{t) — 'Y2, Cne ~~ nn ?sennjrjc - 

n =1 

Las constantes c„ están determinadas por la condición inicial. La novedad es que los vec¬ 
tores característicos son funciones de u(x), ya que el problema es continuo y no discreto. 


Estabilidad de fas ecuaciones diferenciales 

Así como para las ecuaciones en diferencias, los valores característicos deciden cómo se 
comporta u(t) cuando t -*■ oo. En la medida en que sea posible diagonalizar a A, hay n so¬ 
luciones exponenciales puras de la ecuación diferencial, y cualquier solución específica 
u{t) es alguna combinación 

u(t) = Se A ‘S~'u 0 — c 1 e Xlf x 1 + • • • + c n e K ‘x n . 

La estabilidad está regida por estos factores e'- ! . Si todos ellos tienden a cero, entonces u(t) 
tiende a cero; si todos están acotados, entonces u(t) permanece acotado; si uno de ellos se 
infla, entonces excepto por condiciones iniciales muy especiales la solución se infla. Ade¬ 
más, el tamaño de e k! sólo depende de la parte real de X. Lo único que rige la estabilidad 
son las partes reales de los valores característicos : si X = a + ib, entonces 

e Xt _ (eos bt + isenbt) y la magnitud es \e x, \ = e at . 

Lo anterior se desintegra para a < 0, es constante para a = 0, y explota para a > 0. La par¬ 
te imaginaria produce oscilaciones, aunque la amplitud proviene de la parte real. 

'5M La ecuación diferencial duldt = Au es A) . . ' 

estable y e^‘ —> 0 siempre que toda Re X¡ < 0, 
neutralmente estable cuando toda Re l¡SOy Re A.[ = 0, e 
inestable y e 4 ' no está acotado si cualquier valor característico tiene Re X¡ > 0. 

En algunos textos, la condición Re /.< 0 se denomina estabilidad asintótica, porque garan¬ 
tiza desintegración para grandes instantes t. Nuestro razonamiento dependía de contar con 
n soluciones exponenciales puras, pero incluso si A no es diagonalizable (y haya términos 
como te kt ) el resultado sigue siendo cierto: todas las soluciones tienden a cero si y sólo si 
todos los valores característicos tienen Re A.< 0. 

La estabilidad es especialmente fácil de decidir para un sistema de 2 por 2 (que es muy 
común en aplicaciones). La ecuación es 

du f a b 
— = , u, 

dt c d 




Re >.!< 0 
Re X 2 < 0 


la traza a + d debe ser negativa, 
el determinante ad — be debe ser positivo. 


Cuando los valores característicos son reales, estas pruebas garantizan que son negativos. 
Su producto es el determinante; es positivo cuando los valores característicos tienen el mis¬ 
mo signo. Su suma es la traza; es negativa cuando ambos valores característicos son nega¬ 
tivos. 

Cuando los valores característicos son un par complejo x ± iy, las pruebas siguen te¬ 
niendo éxito. La traza es su suma 2x (que es < 0) y el determinante es (x + iy)(x — iy) = 
x 2 + y 2 > 0. En la figura 5.2 se muestra el cuadrante estable, la traza < 0 y el determinan¬ 
te > 0. También se muestra la línea fronteriza parabólica entre los valores característicos 
reales y complejos. La razón de la parábola se encuentra en la ecuación cuadrática para los 
valores característicos: 


(traza)A. + (det) = 0. 


La fórmula cuadrática para X conduce a la parábola (traza) 2 = 4(det): 

X¡ y X 2 — - [traza ± s/ (traza) 2 — 4(det) ]. (14) 

Arriba de la parábola, el número en el radicando es negativo, de modo que A. no es real. So¬ 
bre la parábola, la raíz cuadrada es cero y A. es repetido. Debajo de la parábola, las raíces 
cuadradas son reales. Toda matriz simétrica tiene valores característicos reales, ya que si 
b — c, entonces 

(traza) 2 — 4(det) = (a + d) 2 — 4 (ad — b 2 ) = {a — d) 2 + 4¿> 2 > 0. 

Para valores característicos complejos, by c tienen signos opuestos y son suficientemente 
grandes. 

determinante D 


ambos Re X < 0 
estables 


ambos Re X > 0 
inestables 


valores 

'^característicos complejos 
ambos X < 0 \ 

reales y estables \ 


y 

T 2 = 4£> 


* ambos X > 0 
reales e inestables 


det < 0 proporciona X x < 0 y X 2 > 0: reales e inestables 





272 


Capítulo 5 Valores característicos y vectores característicos 


Ejemplo 2 


Ejemplo 3 


Uno de cada cuadrante: sólo #2 es estable: 


'1 0 " 


r-i oí 


'1 0 ' 


'-1 0 ' 

.0 2 


o 


0 -2 


0 2 . 


Sobre las fronteras del segundo cuadrante, la ecuación es neutralmente estable. Sobre el eje 
horizontal, un valor característico es cero (porque el determinante es X x X 2 = 0). Sobre el 
eje vertical arriba del eje, ambos valores característicos son puramente imaginarios (por¬ 
que la traza es cero). Cruzando estos ejes están las dos formas en que se pierde la estabilidad. 


El caso de n por n es más difícil. Una prueba para Re X¡ < 0 se debe a Routh y Hur- 
witz, quienes encontraron una serie de desigualdades sobre los elementos a¡j. No creo que 
este método sea demasiado bueno para una matriz grande; quizá la computadora encuen¬ 
tre los valores característicos con mayor certidumbre de los que puede probar tales desi¬ 
gualdades. La idea de Liapunov fue encontrar una matriz de ponderación W tal que la 
longitud ponderada ||W«(í)|| siempre es decreciente. Si existe una W así, entonces ||W«|| de¬ 
crece de manera estable a cero, y después de algunos altibajos u también debe llegar ahí 
(estabilidad). El verdadero valor del método de Liapunov, se encuentra para una ecuación 
no lineal; entonces la estabilidad puede demostrarse sin necesidad de conocer una fórmula 
para u(t). 

dujdt = [ i ¿ j u manda a u(t ) alrededor de un círculo, empezando desde «(0) = (1,0). 
Debido a que traza = 0 y det = 1, se tienen valores característicos puramente imaginarios: 

= A. 2 + 1 = 0 de modo que X = + i y —i. 

Los vectores característicos son (1, —i) y (1, i), y la solución es 


■X -1 
1 —X 



f 

+ 

Y 

—i 

2 

i 


Lo anterior es correcto pero no es elegante. Al sustituir eos t ± i sen t para e“ y e~“, vuel¬ 
ven a aparecer números reales : la solución circulante es u(t ) = (eos t, sen í). 

Empezando desde una «(0) = (a, b ) distinta, la solución u(i) termina como 


a eos t — b sen t 


eos t 

—sen f 


a 

b eos t + a sen t 


sen t 

eos í 


b 


(15) 


¡Aquí se tiene algo importante! La última matriz multiplica a «(0), por lo que debe ser la 
exponencial e At . (Recuerde que u(t) = eó‘u{ 0).) Esta matriz de senos y cosenos es nuestro 
ejemplo principal de una matriz ortogonal. La longitud de las columnas es 1, su producto 
interno es cero, y se tiene una confirmación de un hecho maravilloso: 


Si A es simétrica sesgada (A T = —A) entonces e At es una matriz ortogonal. 


A T = —A proporciona un sistema conservador. En amortiguamiento o difusión no se pier¬ 
de energía: 


A T = -A, (s"\ t =íT~--. y \\e A ‘u{Q)\\ = ||«(0)||. 


5.4 Ecuaciones diferenciales y eó‘ 
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La comparación es perfecta si se preserva la misma A. 




(16) 


Dos condiciones iniciales inician el sistema: el “desplazamiento” w(0) y la “velocidad” 
w'(0) Para cumplir estas condiciones, hay 2 n soluciones exponenciales puras. 

Suponga que se usa tu en vez de X, y que estas soluciones especiales se escriben co¬ 
mo u = e i,M x. Al sustituir esta exponencial en la ecuación diferencial, debe cumplir 

— (e ia ”x) = A(e iM x), o bien, -a?x = Ax. (17) 

dt 2 

El vector x debe ser un vector característico de A, exactamente como antes. Ahora el va¬ 
lor característico correspondiente es -cu 2 , de modo que la frecuencia cu está relacionada 
con la razón de desintegración X mediante la ley -cu 2 = X. Toda solución especial a * de 
la ecuación de primer orden lleva a dos soluciones especiales e ,a>, x de la ecuación de se¬ 
cundo orden, y los dos exponentes son cu = ±-/ = X. Lo anterior sólo fracasa cuando 
0, que sólo tiene una raíz cuadrada: si el vector característico es x, entonces las dos solu¬ 
ciones especiales son x y tx. 

Para una matriz de difusión genuina, todos los valores característicos X son negativos 
y todas las frecuencias cu son reales: la difusión pura se transforma en oscilación pura. Los 
factores e im producen estabilidad neutra, la solución no crece ni se desintegra, y la ener¬ 
gía total permanece precisamente constante. Simplemente continúa pasando alrededor del 
sistema. La solución general de d W = Au, si A dene valores característicos negativos 
Xi,..., X„ y si coj = sj-^j .es 

u(t) = (Cl e-“>' + d.e-^xx + • • • + ( c n e i “"' + d^^Xn. (18) 


Como siempre, las constantes se encuentran a partir de las condiciones iniciales. Esto es 
más fácil de hacer (a expensas de una fórmula adicional) cambiando de exponenciales os¬ 
cilatorias a las funciones seno y coseno más conocidas: 


u (t ) = (ai eos cui t + fo[Sencuif)xi — • - • + (a n eos co„t + b n sen co n t)x n . . (19) 


El desplazamiento inicial «(0) es fácil de mantener separado: t = 0 significa que sen wf 
0 y eos vjt = 1, dejando sólo 

u( 0) = aixi + • • • + a n x n , o bien, u( 0) = Sa, o bien, a = S l u( 0). 

Luego de diferenciar u(t) y hacer t = 0, las bs se determinan por la velocidad inicial: 
m'( 0) = b,cu,x, + •• • + b n co n Xn. La ecuación se resuelve al sustituir las as y las ¿>s en la 

fórmula para u(t). 

La matriz A= [“* 4] tiene X, = -lyX 2 =-3. Las frecuencias son «h = 1 y 

coi = V3 . Si el sistema inicia desde el reposo, «'(0) = 0, los términos en b sen cot desapa¬ 
recen: 

"ll ,1 fll . 1 rx. 1 

Solución de «(0) = ^ u{t) — -cosí ^ +^cosv3í • 

Físicamente, dos masas están unidas entre sí y a paredes estacionarias mediante tres 
resortes idénticos (véase la figura 5.3). La primera masa se mantiene a u(0) = 1, la segun¬ 
da se mantiene a iu(0) = 0 y en t = 0 se libera. Su movimiento u(t) se convierte en un pro¬ 
medio de dos oscilaciones puras, correspondientes a los vectores característicos. En el 
primer modo ;q = (1, 1), las masas se mueven juntas y el resorte en el medio jamás se es- 
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Figura 5.3 Los modos de oscilación rápida y lenta. 


tira (véase la figura 5.3a). La frecuencia co¡ = 1 es la misma que para un solo resorte y 
una sola masa. En el modo más rápido x 2 = (1, — 1) con frecuencia V3 , las masas se mue¬ 
ven de manera opuesta pero a la misma velocidad. La solución general es una combina¬ 
ción de estos dos modos normales. La solución particular es la mitad de cada una. 

A medida que transcurre el tiempo, el movimiento es “casi periódico”. Si la razón co x /a> 2 
fuese una fracción como 2/3, las masas terminarían por volver a u( 0) = (1, 0) y empezarían 
de nuevo. Una combinación de sen 2 1 y sen 3 1 tendría un periodo de 2 ir. Sin embargo, v3 
es irracional. Lo mejor que puede decirse es que las masas estarán arbitrariamente próximas 
a (1, 0) y también a (0, 1). Como una bola de billar que rebota por siempre en una mesa per¬ 
fectamente lisa, la energía total es fija. Tarde o temprano las masas llegan cerca de cualquier 
estado con esta energía. 

De nuevo es imposible dejar el problema sin establecer un paralelismo con el caso 
continuo. A medida en que las masas y los resortes discretos se unen en una varilla sólida, 
las “segundas diferencias” dadas por la matriz A 1, —2, 1 se convierten en segundas deri¬ 
vadas. Este límite es descrito por la célebre ecuación de onda d 2 u/dt 2 = dfu/'dx 2 . 


■f Conjunto de problemas 5.4 

1. Siga el primer ejemplo de esta sección, para encontrar los valores característicos y los 
vectores característicos, así como la exponencial eA\ para 



2. Para la matriz previa, escriba la solución general de duldt = Au, así como la solución 
específica que coincida con «(0) = (3, 1). ¿Cuál es el estado estacionario cuando 
t -» oo? (Este es un proceso de Markov continuo; X = 0 en una ecuación diferencial 
corresponde a X = 1 en una ecuación en diferencias, ya que e 0t =1.) 

3. Suponga que la dirección temporal se invierte para obtener la matriz —A: 


du 

dt 


1 

-r 


3 

-1 

i]“ 

con 

u o — j 


Encuentre u(t) y demuestre que se infla en vez de desintegrarse cuando t —» oo. (La 
difusión es irreversible, y la ecuación del calor no puede aplicarse en retrospectiva.) 
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4. Si P es una matriz proyección, a partir de la serie infinita demuestre que 

e p / + 1.718 P. 

5. Una matriz diagonal como A = ° ] satisface la regla de costumbre e A(,+T) = e A, e AT 

ya que la regla se cumple para cada elemento diagonal. 

a ) Explique por qué e A t+T) = e At e AT , usando la fórmula = 5<? Aí S -1 . 
fe) Demuestre que e A+s = e A e B no se cumple para matrices a partir del ejemplo 

A = . „ B = . n (utilice la serie para e 4 y e B ) 

1 u u u 

6. La ecuación de orden superior y" + y = 0 puede escribirse como un sistema de pri¬ 
mer orden si la velocidad y' se introduce como otra incógnita: 


Si ésta es du/dt = Au, ¿cuál es la matriz A de 2 por 2? Encuentre sus valores caracterís¬ 
ticos y sus vectores característicos, y calcule la solución que empieza desde y(0) = 2, 
/(O) = 0. 

7. Transforme y" = 0 a un sistema du/dt = Au de primer orden: 

d y _ y' _ 0 1 y 

Tt l/J ~~ [o J “ [o oj [y'_ ■ 

Esta matriz A de 2 por 2 sólo tiene un vector característico y no es posible diagonali- 
zarla. Calcule er/ a partir de la serie / + Ar + ■ • • y escriba la solución e A, u( 0) empe¬ 
zando desde y (0) = 3, y'(0) = 4. Compruebe que su (y, y') satisface y" = 0. 

8. Suponga que la población de conejos r, y la población de lobos w están regidas por 

dr 

— = 4r — 2w 


—— = r + w. 
dt 

a) Este sistema es ¿estable, neutralmente estable o inestable? 

b ) Si inicialmente r = 300 y w = 200, ¿cuáles son las poblaciones en el instante f? 

c) Al cabo de bastante tiempo, ¿cuál es la proporción de conejos a lobos? 

9. Decida la estabilidad de u’ = Au para las siguientes matrices: 

. . [2 3] ,. . _ 1 2 

d) A 45 ’ b) A ^ _j. 

. . ri il . , r-i - 1 ' 

C) A [! _ 2 j- ^ A [-1-1/ 

10. Decida la estabilidad o inestabilidad de dv/dt — w, dw/dt = v. ¿Existe una solución 
que se desintegre? 

11. Con base en su traza y su determinante, ¿en qué instante t las siguientes matrices cam¬ 
bian entre estables con valores característicos reales, estables con valores característi¬ 
cos complejos e inestables? 

„ Ti -il , _ [0 4 — f I . _\t -r 

Al t -1 ’ Ai 1 -2 ’ 1 t ' 
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12. Encuentre los valores característicos y los vectores característicos para 

du [ 0 3 0' 

= Am = -3 0 4 u. 

dt [0-40 

¿Por qué se sabe, sin necesidad de calcular, que e At es una matriz ortogonal y que 
||m(í)|| 2 = u\ + u\ + u\ es constante? 

13. Para la ecuación simétrica sesgada 

du [ 0 c -b 1 Fui 

—■ — Au = —c 0 a ui , 


L b -a 0J [« 3 J 

d) Escriba wj, u' 2 , u' 3 y confirme que u\ui + u' 2 u 2 + u' 3 u 3 = 0. 

b) Deduzca que la longitud u\ + u\+ u\ es una constante. 

c ) Encuentre los valores característicos de A. 

La solución gira alrededor del eje w = (a, b, c), porque Au es el “producto cruz” u X 
w, que es perpendicular a a y w. 

14. ¿Cuáles son los valores característicos k y las frecuencias w, así como la solución ge¬ 
neral de la siguiente ecuación? 


15. Resuelva la ecuación de segundo orden 

d 2 u [-5 -1 

dF = -l -5 “ COn “ (0) 


16. En la mayor parte de las aplicaciones, la ecuación de segundo orden se ve como Mu"+ 
Ku = 0, con una matriz masa que multiplica a las segundas derivadas. Sustituya la ex¬ 
ponencial pura u = e UM x y encuentre el “problema de valores característicos gene¬ 
ralizado” que es necesario resolver para la frecuencia to y el vector x. 

17. Con una matriz fricción F en la ecuación u" + Fu' — Au = 0, sustituya una exponen¬ 
cial pura u = e Kt x, y encuentre un problema de valor característico cuadrático para X. 

18. Para la ecuación (16) en el texto, con u> — 1 /§, encuentre el movimiento si la pri¬ 
mera masa se golpea en t = 0; u( 0) = (0, 0) y «'(0) = (1,0). 

19. Toda matriz de 2 por 2 con traza cero puede escribirse como 

, f a b + c 
A = , 

b — c —a 

Demuestre que sus valores característicos son reales exactamente cuando a 2 + 
b 2 > c 2 . 

20. Por sustitución hacia atrás o calculando los vectores característicos, resuelva 


'1 

2 

r 

m 

0 

3 

6 u con 

o 

II 

o 

'w-' 

3 

0 

0 

4_ 

UJ 
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21. Encuentre los Xs y los xs de modo que e Xt x resuelva 


¿Qué combinación u = c x e k '‘x, + c,e x ’-'x 2 empieza desde «(0) - (5. -2)? 

22. Resuelva el problema 21 para u(í) = (y(í), z(0) P or sustitución hacia atrás. 


Primero se resuelve 


Z, empezando con z(0) 


Luego se resuelve 


4y 4- 3z, empezando cony(0) — 5. 


La solución para y es una combinación de e 4r y é. 

23. Encuentre A para cambiar y" = 5y'+ 4y en una ecuación vectorial para u(t) = (y (i), 
y'm 


¿Cuáles son los valores característicos de A? Encuéntrelos también por sustitución de 
y = e xt en la ecuación escalar y" = 5y' + 4>\ 

24. Entre dos habitaciones con aforo para u(0) = 30 personas y u>(0) = 10 personas se 
abre una puerta. El movimiento entre las habitaciones es proporcional a la diferencia 


Demuestre que el total u + tu es constante (40 personas). Encuentre la matnz en 
duldt = Au, así como sus valores característicos y vectores característicos. ¿Cuáles 
son v y w en t = 1? 

25. Invierta la difusión de personas en el problema 24 a duldt = -Au: 


El total v + w sigue siendo constante. ¿Cómo cambian los Xs ahora que A ha cambia¬ 
do a -A? Sin embargo, demuestre que v(t) tiende a infinito a partir de u(0) = 30. 

26. La solución de f = 0 es una recta y = C + Dt. Transfórmela en una ecuación matricial: 


tiene la solución 


0 0 [y' 


y'(0)J' 


Esta matriz A no puede diagonalizarse. Encuentre A 2 y calcule e M =1 + Ai + \A 2 t 2 
4- . ... Multiplique su por (y(0), y'(0)) para comprobar la recta y(f) = y(0) + y'(0)í. 

27. Sustituya y = e Xt en y" = 6y' - 9y para demostrar que X = 3 es una raíz repetida. Es¬ 
to es un problema: se requiere una segunda solución después de e 3t . La ecuación ma¬ 
tricial es 


Demuestre que esta matriz tiene X = 3, 3 y sólo una recta de vectores característicos. 
Aquí también se tiene un problema. Demuestre que la segunda solución es y = te . 


U í'4 2 V ir. vi 3 í P A 1. 
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b) La ecuación de segundo orden y" = —y produce una ecuación vectorial u' = Au: 


Escriba y (f) del inciso a) en u(t) = (y, y'). Esto resuelve nuevamente el problema 6. 

30. Una solución particular de duldt = Au — b es u p = A~ l b, si A es invertible. Las solu¬ 
ciones de duldt = Au dan u„. Encuentre la solución completa u p + u n de 


2 u — 8. 


31. Si c no es un valor característico de A, sustituya u = e c 'v, y encuentre v para resolver 
duldt = Au — e c ‘b. Esta u = e ct v es una solución particular. ¿Cómo fracasa cuando c 
es un valor característico? 

32. Encuentre una matriz A para ilustrar cada una de las regiones inestables en la figura 
5.2: 

a) X x < 0 y X 2 > 0. 

b) X x > 0 y X 2 > 0. 

c ) Xs complejos con parte real a > 0. 

Los problemas 33 a 41 son sobre la matriz exponencial e At 

33. Escriba cinco términos de la serie infinita para e At . Tome la derivada t de cada término. 
Demuestre que tiene cuatro términos de Ae At . Conclusión: e A ‘u (0) resuelve u' = Au. 

34. La matriz B — l j tiene B 1 = 0. Encuentre e Bl , a partir de una serie infinita 
(corta). Compruebe que la derivada de e Bt es Be 8 ’. 

35. Empezando desde m( 0), la solución en el instante T es e AT u (0). Pase a un instante adi¬ 

cional t para llegar a e At (e AT u( 0)). Esta solución en el instante t + T también puede es¬ 
cribirse como_. Conclusión: e* 4 ' multiplicado por éA r es igual a_. 


36. Escriba A = ^ 0 0 j en la forma SAS *. Encuentre e A ‘\ a partir de 5e A '5 ,_l . 

37. Si A 2 = A, demuestre que la serie infinita produce e At = / + {e‘ — 1)A. Para A = 

Q J j en el problema 36, con lo anterior se obtiene e At = . 

38. En general, e A e B es diferente de e B e A , y ambas son distintas de e AAB . Compruebe esto, 
usando los problemas 36-37 y 34: 

, = [i ii R = r° -a „ +fí = r 1 °’ 

A L° °J B L° °J A + B [° °. ’ 

39. Escriba A = [o si como S A S~ l . Multiplique Se A ‘S~~ l para encontrar la matriz 
exponencial e* 1 . Compruebe que e*’ = I cuando t = 0. 
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Escriba A — l l en la serie infinita para encontrar e A ‘. Primero calcule A 2 : 


41. Proporcione dos razones por las cuales la matriz exponencial e Ar nunca es singular. 
á) Escriba su inversa. 

b ) Escriba sus valores característicos. Si Ax = Xx, entonces e A ‘x =_ x. 

42. Encuentre una solución x(t), y(t ) del primer sistema que se haga grande cuando r —»• oo. 
Para evitar esta inestabilidad, ¡un científico consideró intercambiar las dos ecuaciones! 

dx/dt — Ox — 4y dy/dt = — 1x + 2 y 

dy/dt = —2x +2 y dx/dt = Ox —4 y. 


Así, la matriz 


es estable. Tiene X< 0. Comente esta locura. 


43. A partir de esta solución general de du/dt = Au, encuentre la matriz A: 


u(t ) = cíe 2. 


E 5.5 MATRICES COMPLEJAS 

Ya no es posible trabajar sólo con vectores y matrices reales. En la primera parte de este li¬ 
bro, cuando el problema básico era Ax = b, la solución era real cuando Ay b eran reales. Hu¬ 
biera sido posible permitir números complejos, aunque eso no hubiera contribuido a nada. 
Ahora ya no es posible evitarlos. Una matriz real tiene coeficientes reales en det (A — XI), 
aunque los valores característicos (como en las rotaciones) pueden ser complejos. 

A continuación se introduce el espacio C" de vectores con n componentes complejas. 
La suma y la multiplicación matriciales obedecen las mismas reglas que antes. La longitud 
se calcula de otra forma. Como se hacía antes, el vector en C 2 con componentes (1, i) po¬ 
día tener longitud cero: 1 2 + i 2 = 0, lo cual no está bien. La longitud al cuadrado correcta es 
1 2 + |¿| 2 = 2 . 

Este cambio a ||x|| 2 + |x¡¡ 2 + • ■ • + \x„\ 2 obliga a toda una serie de cambios. El pro¬ 
ducto intemo, la traspuesta, las definiciones de matrices simétrica y ortogonal, todo esto 
debe modificarse para números complejos. Las nuevas definiciones coinciden con las 
viejas cuando los vectores y matrices son reales. Estos cambios se presentan en una lista al 
final de la sección, y cada cuestión se explica en la medida en que se aborda. 

Esa tabla es virtualmente un diccionario para pasar de real a complejo. Esperamos que 
sea de utilidad para el lector. En particular, se desea incursionar en las matrices simétricas 
y en las matrices hermitianas: ¿Dónde están sus valores característicos, y qué hay de es¬ 
pecial sobre sus vectores característicos ? Para efectos prácticos, estas son las cuestiones 
más importantes en la teoría de los valores característicos. De antemano se solicita aten¬ 
ción para las respuestas: 

1. Toda matriz simétrica {y toda matriz hermitiana ) tiene valores característicos 
reales. 

2. Sus vectores característicos pueden escogerse de modo que sean ortonormales. 

Aunque parezca extraño, para demostrar que los valores característicos son reales se em¬ 
pieza con la posibilidad opuesta, que lleva a números complejos, vectores complejos y ma¬ 
trices complejas. 
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Números complejos y sus conjugados 

Quizá el lector ya tenga experiencia con los números complejos; es fácil proporcionar un re¬ 
paso. Los conceptos importantes son el conjugado complejo Y y el valor absoluto jx|. Todo 
mundo sabe que, no importa qué sea i, si éste cumple la ecuación / 2 = — 1. Se trata de un 
número imaginario puro, como lo son sus múltiplos ib; b es real. La suma a + ib es un nú¬ 
mero complejo, que se gráfica de forma natural en el plano complejo (véase la figura 5.4). 

eje imaginario 



Figura 5.4 El plano complejo, con a + ib = re ,e y su conjugado a — ib = re ie . 

Los números reales a y los números imaginarios ib son los casos especiales de los nú¬ 
meros complejos; están sobre los ejes. La suma de dos números complejos es fácil: 

Suma de números complejos ( a + ib) + (c + id) = (a + c) T i(b + d). 

Al multiplicar a + ib por c + id se aplica la regla de que i 2 — — 1: 

Multiplicación (a + ib)(c + id) = ac 4- i be + iad + i 2 bd 

= (ac — bd) + i(bc + ad). 


El conjugado complejo de a + ib es el número a — ib. Se invierte el signo de las par¬ 
tes imaginarias. Es la imagen especular a través del eje real; cualquier número real es su 
propio conjugado, ya que b = 0. El conjugado se denota por una barra o una estrella: 
(a + ib)* — a + ib =a — ib- Posee tres propiedades importantes: 

1. El conjugado de un producto es igual al producto de los conjugados: 

(a + ib){c + id) — (ac — bd) — i(bc + ad) = (a + ib) (c 4- id). (1) 

2. El conjugado de una suma es igual a la suma de los conjugados: 

(a + c) + i(b + d) = (a + c) — i(b + d) = (a + ib) + (c + id). 

3. Al multiplicar a + ib por su conjugado a — ib se obtiene un número real a 2 + b 2 : 

Valor absoluto (a + ib)(a — ib) = a 2 + b 2 — r 2 . (2) 



Esta distancia r es el valor absoluto j a + ib\ = 
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Por último, la trigonometría relaciona los catetos a y b con la hipotenusa r mediante a - 
r eos 9 y b = r sen 9. Al combinar estas dos ecuaciones se llega a las coordenadas polares: 

Forma polar a + ib = r(cos9 + i señé?) = re' 6 . (3) 

El caso especial más importante es cuando r = 1. Así, a + ib es e ,e = eos 9 + i sen 9, y se 
encuentra sobre la circunferencia unitaria en el plano complejo. A medida que 6 varía de 
0 a 27 r, este número e ,e circula alrededor de cero a la distancia radial constante \e‘ e \ = 



Ejemplo 1 x = 3 + 4i multiplicado por su conjugado x = 3 - 4¿ es igual al valor absoluto al cuadrado: 

xx = (3 + 4¿)(3 - Ai) = 25 = |x| 2 de modo que r = |x| = 5. 

Para dividir entre 3 + 4», el numerador y el denominador se multiplican por su conjugado 
3 - 4¿: 

2 + i 2 + i 3 - 4i _ 10 - 5 í 

3 + 4¿ “ 3 +4¿ 3 -4¿ 25 ' 

En coordenadas polares, la multiplicación y la división son fáciles: 

re' 6 multiplicado por Re ia tiene valor absoluto rR y ángulo 9 + a. 
re' 0 dividido entre Re iar tiene valor absoluto r/R y ángulo 9 — a. 

Longitudes y traspuestas en el caso complejo 

Volvemos al álgebra lineal, y se efectúa la conversión de reales a complejos. Por defini¬ 
ción, el espacio vectorial complejo C" contiene a todos los vectores x con n componentes 
complejas: 

~x\ 
x 2 

Vector complejo x= . con componentes x¡=aj+ibj. 

x n 

La suma de los vectores xyy sigue haciéndose componente por componente. La multiplica¬ 
ción escalar ex ahora se realiza con números complejos c. Los vectores v x ,... ,v k son lineal¬ 
mente dependientes si alguna combinación no trivial proporciona c 1 u l + • • • +c k v k =0; 
ahora los c } deben ser complejos. Los vectores de coordenadas unitarios siguen estando en 
C"; siguen siendo independientes, y siguen siendo una base. En consecuencia, C" es un es¬ 
pacio vectorial complejo de dimensión n. 

En la nueva definición de longitud, cada x j se sustituye por su módulo |x/: 

Longitud al cuadrado ||x|| 2 = |xi| 2 + - • • + |x„| 2 . (4) 

Ejemplo 2 x = ! y ||x|| 2 =2; y= 2 - Ai y ll 2 = 25. 

Para vectores reales, entre la longitud y el producto interno había una relación estrecha: 
||x|| 2 = x T x. Se desea preservar esta relación. El producto intemo debe modificarse para 
coincidir con la nueva definición de longitud, de modo que en el producto interno se con¬ 
juga el primer vector. Al sustituir x por x , el producto interno se convierte en 

Producto interno x T y = x\y\ + - •,%:+ x n y n . (5) 
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Si se toma el producto intemo de x = (1 + i, 3i) consigo mismo, se regresa a ||x|¡ 2 : 

Longitud al cuadrado x T x = (1 + ¿)(1 + i ) + (30(3i) =2 + 9 y ||x|| 2 = 11. 

Observe que y T x es diferente de x T y; es necesario vigilar el orden de los vectores. 

Lo anterior deja un solo cambio más en la notación, resumiendo dos símbolos en 
uno. En vez de una barra para el conjugado y una T para la traspuesta, estos símbolos se 
combinan en la traspuesta conjugada. Para vectores y matrices, un supraíndice H (o una 
estrella) combina ambas operaciones. Esta matriz A f = a h = A* se denomina “A her- 
mitiana”: 

“A hermitiana” A H = A T tiene elementos (A H ) ¡; - = ~A¡J. (6) 

El lector debe estar muy atento para distinguir esta denominación de la expresión “A es her¬ 
mitiana”, lo cual significa que A es igual a A H . Si A es una matriz de m por n, entonces A H 
es de n por m: 

Traspuesta 2 + [ 3l _[2~i 4 + i 0' 

conjugada 4 0 ' 0 ~ 3i 5 0 

Este símbolo A H otorga reconocimiento oficial al hecho de que, con elementos complejos, 
es muy raro que sólo se busque la traspuesta de A. Es la traspuesta conjugada A H lo que se 
vuelve idóneo, y x 19 es el vector renglón l x \ ■ ■■ x „ ]. 

5M 1. El producto intemo de x y y es x íi y. Los vectores ortogonales cumplen 
'■ x H y = 0. 

2. La longitud al cuadrado de x es ||x|| 2 = x H x = ¡Xi| 2 + • • • + [x„| 2 . 

3. Al conjugar (Afi) T = B r A T se obtiene (AB) H = B H A H . 

Matrices hermitianas 

En capítulos previos se habló de matrices simétricas: A = A T . Con elementos complejos, 
es necesario ampliar el concepto de simetría. La generalización correcta no es hacia matri¬ 
ces que son iguales a su traspuesta, sino a matrices que son iguales a su traspuesta con¬ 
jugada. Estas son las matrices hermitianas, de las cuales un ejemplo típico es: 

Matriz hermitiana A — ~ ^ 3 ■ 3 * = A H . (7) 

3 + 5i 5 

Los elementos diagonales deben ser reales ; la conjugación los deja sin cambio. Cada ele¬ 
mento fuera de la diagonal es compensado por su imagen especular a través de la diagonal 
principal, y 3 — 3 i es el conjugado de 3 + 3¿. En cada caso, a¡j = aj¡. 

Nuestro objetivo principal es establecer tres propiedades básicas de las matrices her¬ 
mitianas. Estas propiedades son igualmente válidas para las matrices simétricas. Una ma¬ 
triz simétrica real ciertamente es hermitiana. (Para matrices reales no hay diferencia entre 
A t y A h ). Los valores característicos de A son reales, como se demostrará a continuación. 

Propiedad 1 Si A = A H , entonces para todos los vectores complejos x, el número 
x^Ax, es real. ' 
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Cada elemento de A contribuye a x^Ax. Intente el caso de 2 por 2 con x = ( u , n): 


3¿1 F u 


x H Ax = [u i>] 


= 2 uu + 5vv + (3 — 3i)uv + (3 + 3 ¿)uv 
= real + real + (suma de conjugados complejos). 

Para una demostración en general, (x H Ax) H es el conjugado de la matriz de 1 por 1 
x tl Ax, aunque en realidad se obtiene otra vez el mismo número: (x H Ax) H = ;t H A H ;c HH = 
x h Ax■ Por tanto, este número debe ser real. 

Propiedad 2 Si A = A H , todo valor característico es real. 

Demostración Suponga que Ajc = Xx. El truco consiste en multiplicar por 
x 11 : x h Ax = Xx H x ■ Por la propiedad 1, el miembro izquierdo es real, y el miembro dere¬ 
cho x H x = Hjc¡| 2 es real y positivo, ya que x ¥= 0. En consecuencia, x = x H Ax/x H x 

debe ser real. En el ejemplo se tiene A = 8 y A = —1: 

I* - l, l - | i + 3i 5 ~-l | ™ + 10 ~ |3 - 3,f 

= A 2 - IX - 8 = (X - 8)(X + 1). (8) 

■ 

Nota Esta demostración de valores característicos reales es conecta para cualquier ma¬ 
triz real: 


Demostración 


Ax = Xx proporciona x r Ax = Xx T x , de modo que X = 


es real. 


Debe haber una trampa: El vector característico x podría ser complejo. Es cuando A = A T 
que se tiene la certeza de que X y x son reales. Más que eso, los vectores característicos 
son perpendiculares: x T y = 0 en el caso simétrico real y x^y — 0 en el caso hermitiano 
complejo. 

Propiedad 3 Dos vectores característicos de una matriz simétrica real o de una ma¬ 
triz hermitiana, si provienen de valores característicos distintos, son ortogonales en¬ 
tre sí.' : ' ; yV : yyy.'. 


La demostración empieza con Ax = A(X, Ay = X 2 y , y A = A H : 

(XiJ:) H y = (Ax) H y = x H Ay = x H (X 2 y). (9) 

Los números exteriores son A);c H y = X 2 x H y, ya que los Xs son reales. Ahora se utiliza la 
hipótesis de que A.! ¥> X 2 , que obliga a concluir que jpy = 0. En el ejemplo. 


(A -8/)* 


(A + I)y 


3 — 3 i x\ 
—3 x 2 

3 — 3 i yi 
6 y 2 


Estos dos vectores característicos son ortogonales: 


*> = [1 
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Por supuesto, cualesquiera múltiplos x/cc y y//3 son igualmente válidos que los vecto¬ 
res característicos. MATLAB escoge a = ||x|| y /3 = ||y||, de modo que xja y y/(3 son vec¬ 
tores unitarios; los vectores característicos son normalizados para que su longitud sea 1. 
Ahora son ortonormales. Si estos vectores característicos se escogen como las columnas 
de S, entonces se tiene S~ l AS = A , como siempre. La matriz de diagonalización puede 
escogerse con columnas ortonormales cuando A = A H . 

En caso de que A sea real y simétrica, por la propiedad 2 sus valores característicos 
son reales. Por la propiedad 3, sus vectores característicos unitarios son ortogonales y tam¬ 
bién son reales; resuelven (A — XI)x = 0. Estos vectores característicos ortonormales van 
en una matriz ortogonal Q, 

con Q r Q = I y Q r = Q~ 1 . Así, S~ l AS = A se vuelve especial: es Q~' 1 AQ = A o 
A = QAQ~ l = QAQ r . Ahora es posible enunciar uno de los grandes teoremas del álge¬ 
bra lineal: 

50 Una matriz simétrica real puede factorizarse.ee A = QAQ T . Sus vectores ca¬ 
racterísticos ortonormales están en la matriz ortogonal Q, y sus .valores característi¬ 
cos están en A. 

En geometría o mecánica, este es el teorema de los ejes principales. Proporciona la 
elección correcta de ejes para una elipse. Estos ejes son perpendiculares, y apuntan a lo lar¬ 
go de los vectores característicos de la matriz correspondiente. (En la sección 6.2 se rela¬ 
cionan las matrices simétricas con elipses «-dimensionales). En mecánica, los vectores 
característicos proporcionan las direcciones principales, a lo largo de las cuales hay com¬ 
presión pura o tensión pura, sin esfuerzo de corte. 

En matemáticas, la fórmula A = QAQ r se conoce como teorema espectral. Si se multi¬ 
plican las columnas por los renglones, la matriz A se convierte en una combinación de proyec¬ 
ciones unidimensionales, que son las matrices especiales xx T de rango 1, multiplicadas por A: 



= AiVixJ + X 2 x 2 x 2 + - • • + X n x n xJ. (10) 

En el ejemplo los valores característicos son 3 y 1: 

, ,i r i —ii ri ii 

Ejemplo 3 A = =3 2 2 + 2 2 = combinación de dos proyecciones 

2 l 2 2 J L 2 2 . 

Los vectores característicos, con longitud escalada a 1, son 

i r i] i rr 

Xl V2 L-iJ y Xl ./i k' 

Así, las matrices del miembro derecho son x\xj y x 2 x 2 —columnas por renglones— y 
son proyecciones sobre la recta que pasa por x x y la recta que pasa por x 2 . 

Todas las matrices simétricas son combinaciones de proyecciones unidimensionales, 
que son matrices simétricas de rango 1. 

Observación Si A es real, y ocurre que sus valores característicos son reales, entonces tam¬ 
bién sus vectores característicos son reales. Resuelven (A — A l)x = 0 y pueden calcularse 
por eliminación. Sin embargo, no son ortogonales, a menos que A sea simétrica: 
A = QAQ r lleva a A t = A. 
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Si A es real, todos los valores característicos complejos se convierten en pares conju¬ 
gados: Ax = Xx y Ax = Xx. Si a + ib es un valor característico de una matriz real, tam¬ 
bién lo es a - ib. (Si A = A T , entonces b = 0.) 

Hablando estrictamente, el teorema espectral A = QAQ T sólo se ha demostrado 
cuando los valores característicos de A son distintos. Entonces ciertamente hay n vectores 
característicos independientes y A puede diagonalizarse con seguridad. No obstante, es 
cierto (consulte la sección 5.6) que incluso con valores característicos repetidos, una ma¬ 
triz simétrica sigue teniendo un conjunto completo de vectores característicos ortonorma- 
les. El caso extremo es la matriz identidad, que tiene X = 1 repetido n veces, y no carece 
de vectores característicos. 

Para terminar el caso complejo se requiere el análogo de una matriz ortogonal real, y 
el lector puede conjeturar lo que ocurre al requerimiento Q T Q — I. La traspuesta se susti¬ 
tuye por la traspuesta conjugada. La condición se vuelve U H U = I. La nueva letra U refle¬ 
ja la nueva denominación: Una matriz compleja con columnas ortonormales se 
denomina matriz unitaria. 

Matrices unitarias 

¿Se nos permite proponer dos analogías? Una matriz hermitiana (o simétrica) puede com¬ 
pararse con un número real. Una matriz unitaria (u ortogonal) puede compararse con 
un número en la circunferencia unitaria: un número complejo de valor absoluto 1. Los 
Xs son reales si A H = A, y están en la circunferencia unitaria si U H U = I. Los vectores ca¬ 
racterísticos pueden escalarse a longitud unitaria y hacerse ortonormales.’ 

Hay dos afirmaciones aún no demostradas para matrices unitarias (incluyendo las or¬ 
togonales). En consecuencia, pasamos de inmediato a las tres propiedades de U que corres¬ 
ponden a las propiedades anteriores 1 a 3 de A. Recuerde que las columnas de U son 
ortonormales: 

Matriz unitaria U H U = I, UU H = /, y U H = U~'. 

Lo anterior lleva directamente a la propiedad 1', que la multiplicación por U no afecta los 
productos internos, los ángulos, o las longitudes. La demostración se hace en una línea, jus¬ 
to como lo fue para Q: 

Propiedad 1' ( Ux) H {Uy) = x H U H Uy = x H y y U preserva las longitudes: 

La longitud permanece sin cambio \\Ux\\ 2 = x H t/ H í/x = ||x|| 2 . (11) 

Propiedad 2' Todo valor característico de U tiene valor absoluto ¡A.| = 1. 

Lo anterior se concluye directamente de Ux = Xx, al comparar las longitudes de los 
dos miembros: \\Ux\\ = ||x|| por la propiedad 1', y siempre l|A.x|| = |A.|||x)|. En conse¬ 
cuencia, |X| = 1. 

Propiedad 3' Los vectores característicos correspondientes a valores característicos 

distintos son ortonormales. 

'Más tarde se compararán las matrices “antihermitianas" con los números imaginarios puros, y las matrices “nor¬ 
males” con todos los números complejos a + ib. Una matriz no normal sin vectores característicos ortogonales 
no pertenece a ninguna de estas clases, y está fuera de toda analogía. 
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Ejemplo 4 


Se empieza con Ux — X¡x y Uy = X¿y, y se toman productos internos por la propiedad 1': 
x H y = ( Ux) H (Uy ) = (X,;e) H (A. a y) = X,X 2 x H y. 

Al comparar la izquierda con la derecha, X { X 2 = 1 o x H y = 0. Pero la propiedad 2' es 
X[X¡ = 1, por lo que no puede tenerse X¡X 2 — 1. Así, x H y = 0 y los vectores característicos 
son ortogonales. 


cosí —senf 
senf cosí 


tiene valores característicos e i! ye lt . 


Los vectores característicos ortogonales sonx = (1, -i) y y = (1, í). (Recuerde tomar con¬ 
jugados en x^y — 1 + i 2 — 0). Después de la división entre son ortonormales. 

A continuación se presenta la matriz unitaria, con mucho, la más importante que hay. 


Ejemplo 5 


Matriz de Fourier 


Ejemplo 6 


El número complejo w está en la circunferencia unitaria al ángulo 9 = 2 ntn. Es igual a 
e lnün . Sus potencias son equidistantes alrededor de la circunferencia. Esa separación asegu¬ 
ra que ¡a suma de todas las n potencias de w —todas las raíces n-ésimas de 1— es cero. Al¬ 
gebraicamente, la suma 1 + ut + • ■ • + w"~ l es (w n - l)/(w - 1). ¡Y (w n - 1) es cero! 
el renglón 1 de U H multiplicado 1 , , , , , „_, s w n — 1 

por la columna 2 de U es n w — 1 


W n - 1 
W - 1 


el renglón i de (/« multiplicado l (í + w+w3 + ,.. + , = 5_lr 1 = 0 

por la columna j de U es n W — 1 

En el segundo caso, W — w J ~‘. Cada elemento de la F original tiene valor absoluto igual 
a 1. El factor ^fn encoge las columnas de U en vectores unitarios. La identidad funda¬ 
mental de la transformada finita de Fourier es U H U = l. 

Así, U es una matriz unitaria. Su inversa se ve igual, excepto que w se sustituye por 
ty-t = e -,s = uJ. Debido a que U es unitaria, su inversa se encuentra trasponiendo (con 
lo cual todo permanece igual) y conjugando (con lo cual w cambia a w). La inversa de es¬ 
ta U es U. Ux puede calcularse rápidamente mediante la transformada rápida de Fourier 
según se encontró en la sección 3.5. 

Por la propiedad 1 ’ de las matrices unitarias, la longitud de un vector x es la misma 
que la longitud de Ux. La energía en el espacio estado es igual a la energía en el espacio 
transformado. La energía es la suma de |x,| 2 , y también es la suma de las energías en las 
frecuencias por separado. El vector x = (1, 0, . . . , 0) contiene cantidades iguales de cada 
componente de la frecuencia, y su transformada de Fourier discreta Ux ={ 1,1,..., 1)/ 
■Jñ también tiene longitud 1. 

'0 10 0 ' 

„ = 0 0 1 o 
0 0 0 1’ 

10 0 0 


Esta es una matriz ortogonal, de modo que por la propiedad 3' debe tener vectores carac¬ 
terísticos ortogonales. ¡Estos son las columnas de la matriz de Fourier! El valor absoluto 
de sus valores característicos debe ser 1. 
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Hay números 1, w ,..,, w n 1 (o 1 ,¡,i 2 , i 3 en este caso de 4 por 4). Es una matriz real, aun¬ 
que sus valores característicos y vectores característicos son complejos. 


Una nota final: Las matrices antihermitianas cumplen K H = —K, así como las matri¬ 
ces simétricas sesgadas satisfacen K r = —K. Sus propiedades se concluyen de inmediato, 
a partir de su estrecho vínculo con las matrices hermitianas: 


Si A es hermitiana, entonces K = iA es anti hermitiana. 


Los valores característicos de K son puramente imaginarios, en vez de puramente reales; 
se multiplica por i. Los vectores característicos no cambian. El ejemplo hermitiano de las 
páginas previas conduciría a 



Los elementos diagonales son múltiplos de i (permitiendo el cero). Los valores caracterís¬ 
ticos son 81 y —i. Los vectores característicos siguen siendo ortogonales, y sigue teniéndo¬ 
se K = U AU H —con una U unitaria en vez de una Q ortogonal real, y con 8¿ y —i en la 
diagonal de A. 

Esta sección se resume con una tabla de paralelismos entre reales y complejos. 


Real contra complejo 


R" (n componentes reales) 


C" (n componentes complejas) 

longitud: ||x|| 2 = x¡ + • • • +x 2 

<-> 

longitud: ||x|| 2 = |x[| 2 + • • • + |x„| 2 

traspuesta: Aj = A;¡ 

•<-> 

traspuesta hermitiana: Afj = Ay, 

(. AB) J = b t a t 

** 

(A5) h = B h A h 

producto intemo: x T y = x¡y¡ + • 

* ‘ ** 

x H y = xlyx + • • • + x n y n 

(Ax) T y = x T (A T y) 

-O- 

(Ax) H y = x H (A H y) 

ortogonalidad: x T y = 0 


ortogonalidad: x H y = 0 

matrices simétricas: A T = A 


matrices hermitianas: A H = A 

A = QAQ~ l = <2A<2 t (A real) 

■<-> 

A = UAU- 1 = UAU h (A real) 

simétrica sesgada K T = —K 

<-> 

antihermitiana K H = —K 

ortogonal Q r Q = / o bien, Q J 

= Q-' 

U H U = I unitaria o bien U H — U~ l 

(Qx) T {Qy) = x T y y ||£>x|| = 

II* II ■*+ 

(Ux) H (Uy) = x H y y ||t/x|| = ||x|| 


Las columnas, los renglones, y los vectores característicos de Q y U son ortonormales, y todo |A| = 1. 


Conjunta de problemas 5.5 


1. Para los números complejos 3 + 41 y 1 — i: 

a) Encuentre sus posiciones en el plano complejo. 

b) Encuentre su suma y su producto. 

c) Encuentre sus conjugados y sus valores absolutos. 

¿Los números originales están dentro o fuera de la circunferencia unitaria? 
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2. ¿Qué puede decir sobre 

a) la suma de un número complejo y su conjugado? 

b) el conjugado de un número que está sobre la circunferencia unitaria? 

c) el producto de dos números que están sobre la circunferencia unitaria? 

d) la suma de dos números que están sobre la circunferencia unitaria? 

3. Si x — 2 + i y y — 1 + 31, encuentre x, xx, xy, 1/ x y x/y. Compruebe que el valor 
absoluto |ry| es igual a |x| multiplicado por |y|, y que el valor absoluto |l/x| es igual a 1 
dividido entre |x|. 

4. Encuentre ay b para los números complejos a + ib a los ángulos 9 = 30°, 60°, 90° 
sobre la circunferencia unitaria. Compruebe por multiplicación directa que el cuadra¬ 
do del primero es el segundo, y que el cubo del primero es el tercero. 

5. a) Si x = re ie , ¿cuáles son x 2 , x~ l , y x en coordenadas polares? ¿Dónde están los nú¬ 

meros complejos que tienen x " 1 =x? 

b) En t = 0, el número complejo e (_1+í)t es igual a la unidad. Trace su trayectoria en 
el plano complejo cuando t crece desde 0 hasta 2-rr. 

6. Encuentre las longitudes y el producto intemo de 


7. Escriba la matriz A H , y calcule C = A H A si 


1 i 0 
i 0 1 


¿Cuál es la relación entre C y C H ? ¿Esto se cumple siempre que C se construye a par¬ 
tir de alguna A H A? 

8. a) Con la A precedente, use eliminación para resolver Ax = 0. 

tí) Demuestre que el espacio nulo que calculó es ortogonal a C(A H ) y no al espacio 
renglón de costumbre C(A T ). Los cuatro espacios fundamentales en el caso com¬ 
plejo son N(A) y C(A) como antes, y luego ATA H ) y C(A H ). 

9. a) ¿Cómo está relacionado el determinante de A H con el determinante de A? 
tí) Demuestre que el determinante de cualquier matriz hemútiana es real. 

10. o) ¿Cuántos grados de libertad hay en una matriz simétrica real, en una matriz diago¬ 

nal real, y en una matriz ortogonal real? (La primera respuesta es la suma de las 
otras dos, ya que A = QAQ T .) 

tí) Demuestre que las matrices hermitianas A de 3 por 3 y también la U unitaria tienen 
9 grados de libertad (las columnas de U pueden multiplicarse por cualquier e' 6 ). 

11. Escriba P, Q y R en la forma A.,*,*} 1 + X 2 x 2 xf del teorema espectral: 


P = 


0 1 
1 0 


R = 


3 4 

4 -3 
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12. Proporcione una razón si es verdadero o un contraejemplo si es falso: 

a) Si A es hermitiana, entonces A + il es invertible. 

b) Si Q es ortogonal, entonces Q + §1 es mvertible. 

c) Si A es real, entonces A + il es invertible. 

13. Suponga que A es una matriz simétrica de 3 por 3 con valores característicos 0, 1, 2. 

a) ¿Qué propiedades pueden garantizarse para los vectores característicos unitarios 
correspondientes u, v, w7 

b) En términos de u, v, w, describa el espacio nulo, el espacio nulo izquierdo, el esp 

ció renglón, y el espacio columna de A. . 

c) Encuentre un vector x que cumpla Ax = v + ui, ¿x es único. 

d) ¿En qué condiciones sobre b, Ax = b tiene una polución? 
é) Si u, v, w son las columnas de S, ¿cuáles son S y S AS. 

14. En la siguiente lista, ¿qué clases de matrices contienen a A, y cuáles contienen a B? 

'0 1 0 01 f 1 1 1 1 

0010 o = i 1 1 1 1 

A ~ 0 0 0 1 Y 41111 

1 0 0 oj L 1 1 1 1 - 

Ortogonales, invertibles, proyección, permutación, hermitianas, de rango 1, diagona- 
lizables, de Markov. Encuentre los valores característicos de A y B. 

15 ;Cuál es la dimensión del espacio 5 de todas las matrices simétricas reales de n por n? 
El teorema espectral establece que toda matriz simétrica es una combinación de «ma¬ 
trices proyección. Debido a que la dimensión excede a n, ¿como se explica esta dife¬ 
rencia? 

16. Escriba un hecho importante sobre los valores característicos de cada uno de los si¬ 
guientes incisos. 

a) Una matriz simétrica real. 

b) Una matriz estable: todas las soluciones de du/dt - Au tienden a cero. 

c ) Una matriz ortogonal. 

d) Una matriz de Markov. 

e) Una matriz defectuosa (no diagonalizable). 

f) Una matriz singular. 

17. Demuestre que si ¡7 y V son unitarias, también lo es U V. Use el criterio U H U = I. 

18. Demuestre que una matriz unitaria tiene |det U] = 1, aunque quizá det U es diferente 
de det U H . Describa todas las matrices de 2 por 2 que son unitarias. 

19. Encuentre una tercera columna, de modo que U sea unitaria. ¿Cuánta libertad hay en 

la columna 3? _ 

"1/V3 i/V2 

U = 1/V3 0 

J/V3 1/V2 

20. Diagonalice la matriz antihermitiana de 2 por 2 K = jj )], cuyos elementos son to¬ 
dos 'f~Á- 
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Calcule e Kt = Se A, S 1 y compruebe que e Kt es unitaria ¿Cuál es la derivada de e Kt 
en t ~ 0? 

21. Describa todas las matrices de 3 por 3 que simultáneamente son hermitianas, unitarias, 
y diagonales. ¿Cuántas hay? 

22. Toda matriz Z puede separarse en una parte hermitiana y una parte antihermitiana, 
Z = A + K, así como un número complejo z puede separarse en a + ib. La parte real 
de z es la mitad de z + z, y la “parte real” de Z es la mitad de Z + Z H . Encuentre una 
fórmula semejante para la “parte imaginaria” K, y separe estas matrices en A + K: 

3 + i 4 + 2/ ~ i i 

Z — „ . y Z — . . . 

0 5 [— i i 

23. Demuestre que las columnas de la matriz de Fourier de 4 por 4 en el ejemplo 5 son 
vectores característicos de la matriz permutación P en el ejemplo 6. 

24. Para la permutación en el ejemplo 6, escriba la matriz circulante C = CqI + c v P + 
c 2 P 2 + c 3 P 3 . (Su matriz vector característico es nuevamente una matriz de Fourier.) 
También escriba las cuatro componentes del producto matriz-vector Cx, que es la con- 
volución de c = (c 0 , Ci,c 2 , c 3 ) y x = (x 0 , x,, x 2 , x 3 ). 

25. Para una matriz circulante C = FAF~ l , ¿por qué es más rápido multiplicar por F ~ 1 , 
luego por A, y luego por F (regla de convolución), que multiplicar directamente por 
C? 

26. Encuentre las longitudes de u = (1 + i, 1 — i, 1 + 2i) y v — ( i, i, i). También encuen¬ 
tre u H v y v H u. 

27. Demuestre que A H A siempre es una matriz hermitiana. Calcule A H A y AA H : 


28. Si Az = 0, entonces A H Az = 0. Si A H Az = 0, multiplique por z H para demostrar que 

Az = 0. Los espacios nulos de A y A H A son_. A H A es una matriz hermitiana in¬ 
vertible cuando el espacio nulo de A sólo contiene a z =_, 

29. Cuando una matriz hermitiana se multiplica por un número real c, ¿cA sigue siendo 
hermitiana? Si c = i, demuestre que i A es antihermitiana. Las matrices hermitianas 
de 3 por 3 constituyen un subespacio, en el supuesto de que los “escalares” sean nú¬ 
meros reales. 

30. ¿Qué clases de matrices P pertenecen a: ortogonales, invertibles, hermitianas, unita¬ 
rias, factorizables en LU, factorizables en QR1 

'0 1 0' 

P = 0 0 1 . 

1 0 0 _ 

31. Calcule P 2 , P 3 , y P 100 en el problema 30. ¿Cuáles son los valores característicos de P? 

32. Encuentre los vectores característicos unitarios de P en el problema 30, y luego escrí¬ 
balos en las columnas de una matriz unitaria U. ¿Qué propiedad de P hace ortogona¬ 
les a estos vectores característicos? 


f 
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Escriba la matriz circulante de 3 por 3 C = 2/ + 5 P + 4 P 2 . Tiene los mismos vecto¬ 
res característicos que P en el problema 30. Encuentre sus valores característicos. 

Si U es unitaria y 2 es una matriz ortogonal real, demuestre que es unitaria, y 
también que UQ es unitaria. Empiece con U H U = I y Q T Q = /• 

Diagonalice A (Xs reales) y K (Xs imaginarios) para llegar a UAU H : 


Diagonalice la siguiente matriz ortogonal para llegar a Q = U AU H . Ahora todos los 
Xs son_. 

_ eos 9 —sen 9 
^ sen3 eos 9 

Diagonalice la siguiente matriz unitaria, V para llegar a V = U AU H - Nuevamente, to¬ 
dos los |X| = 1: 

y = _L í 1 1-0 

V3 L 1 +i -1 I 

Si v,, . . . , v„ es una base ortonormal de C", la matriz con estas columnas es una ma¬ 
triz _. Demuestre que cualquier vector z es igual a (vfzjoi + • • • + (v¡^z)v„. 

Las funciones e~ u y e“ son ortogonales en el intervalo 0 < x <2n porque su produc¬ 
to interno complejo es f„ K _= 0. 

Los vectores v = (1, i, 1) , w = (i, 1, 0) y z =_son una base ortogonal de_. 

Si A = R + iS es una matriz hermitiana, ¿las matrices R y S, son simétricas? 

La dimensión (compleja) de C" es_. Encuentre una base no real de C". 

Describa todas las matrices de 1 por 1 que sean hermitianas y también unitarias. Ha¬ 
ga lo mismo para las matrices de 2 por 2. 

¿Cómo están relacionados los valores característicos de A H (una matriz cuadrada) con 
los valores característicos de A? 

Si « H « = 1, demuestre que I — 2uu H es hermitiana y también unitaria. La matriz uu H 
de rango 1 es la proyección sobre ¿qué recta en C"? 

Si A + iB es una matriz unitaria {Ay B son reales), demuestre que Q — ^ a ] es 
una matriz ortogonal. 

Si A + iB es una matriz hermitiana {Ay B son reales), demuestre que ^ g ^ ] es si- 


Demuestre que la inversa de una matriz hermitiana también es hermitiana. 

Diagonalice la siguiente matriz, construyendo su matriz valor característico A y su 
matriz vector característico S: 


Una matriz con vectores característicos ortonormales es de la forma A = U A U 1 = 
UAU h . Demuestre que AA H = A H A. Éstas son exactamente las matrices normales. 
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m 5.6 TRANSFORMACIONES DE SEMEJANZA 

Virtualmente, cada paso de este capítulo implicó la combinación l AS. Los vectores carac¬ 
terísticos de A se fueron en las columnas S, con lo cual S 1 AS se volvió una matriz diagonal 
(denominada A). Una vez que A era simétrica, en vez de S, se escribió Q, escogiendo que los 
vectores característicos fuesen ortonormales. En el caso complejo, cuando A es hermitiana, 
se escribió U, que sigue siendo la matriz de vectores característicos. Ahora se consideran to¬ 
das las combinaciones M~ 1 AM, formadas con cualquier M invertible en la derecha y su in¬ 
versa en la izquierda. La matriz vector característico invertible S podría no existir (el caso 
defectuoso), o podría no ser conocida, e incluso podríamos no querer utilizarla. 

Primero un nuevo comentario: Las matrices A y M~ 1 AM son “semejantes”. Pasar de 
una a otra es una transformación de semejanza. Es el paso natural para las ecuaciones di¬ 
ferenciales o matrices de potencias o valores característicos; así como los pasos de la eli¬ 
minación eran naturales para Ax = b. La eliminación multiplicaba A por la izquierda por 
L~ l , pero no lo hacía por la derecha por L. De modo que U no es semejante a A, y los pi¬ 
votes no son los valores característicos. 

Toda una familia de matrices M~ l AM es semejante a A, y hay dos preguntas: 

1. ¿Qué tienen en común estas matrices semejantes M _1 AA/? 

2. Con una elección especial de M, ¿qué forma especial puede obtenerse mediante 
AT'AM? 

La respuesta final la proporciona la forma de Jordán, con la que termina el capítulo. 

Estas combinaciones M~ l AM se presentan en una ecuación diferencial o en diferen¬ 
cias, cuando un “cambio de variables” u = Mv introduce la nueva incógnita v: 

du . dv dv 

— = Au se convierte en M — — AMv, obten, — = M l AMv 
dt dt dt 

u n+l = Au n se convierte en Mv n+ \ = AMv n , o bien, t>„+i = M~ l AMv n . 

La nueva matriz en la ecuación es M~ X AM. En el caso especial M = S, el sistema no está 
acoplado porque A = 5 _, A5 es diagonal. Los vectores característicos evolucionan de 
manera independiente. Esta es la simplificación máxima, aunque también son de utilidad 
otras Ms. Se intentará que trabajar con M~ l AM sea más fácil que hacerlo con A. 

La familia de matrices M~ X AM incluye a A misma, eligiendo M = I. Cualquiera de 
estas matrices semejantes puede aparecer en las ecuaciones diferencial y en diferencias, 
mediante el cambio u = Mv, por lo que deben tener algo en común, como es el caso: las 
matrices semejantes comparten los mismos valores característicos. 

5P. Suponga que B = M~ l AM. Entonces Ay 8 tienen los mismos valores carac¬ 
terísticos. Todo vector característico x de A corresponde a un vector caracterís¬ 
tico M~ x x de B. 

Empiece con Ax = Xx y sustituya A = M B M~ x : 

Mismo valor característico MBM~ l x = Xx que es B{M~ x x ) =A ,{M~ l x). (1) 
El valor característico de B sigue siendo X. El vector característico ha cambiado de x a 
M~ l x. 

También puede comprobarse que A — XI y B — XI tienen el mismo determinante: 
Producto de matrices B — XI = M~~ x AM — XI = M~ X {A — Xl)M 

Regla del producto det (B — XI) = det M~' det (A — XI) det M = det (A — XI). 
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Los polinomios det(A - XI) y detífí - XI) son iguales. Sus raíces —los valores caracte¬ 
rísticos de A y B— son los mismos. A continuación se presentan las matrices B que son se¬ 
mejantes a A. 


Ejemplo 1 


A = [¿ q j tiene valores característicos 1 y 0. Cada B es M l AM: 

|, entonces B ~\ \ ^ : triangular con X = 1 y 0. 

J, entonces B = \ \ f ]: proyección con X = 1 y 0. 


Si M 

Si M 


1 b 
0 1 


1 1 

-1 1 


rl n 
2 2 
1 1 
L 2 2 


Si M 


a b 
c d 


entonces B = una matriz arbitraria con X = 1 y 0. 


En este caso es posible producir cualquier B con los valores característicos correctos. Se 
trata de un caso fácil, ya que los valores característicos 1 y 0 son distintos. La matriz dia¬ 
gonal A en realidad era A, el elemento distinguido de esta familia de matrices semejantes. 
La forma de Jordán estará preocupada sobre valores característicos repetidos y una posible 
carencia de vectores característicos. Todo lo que se dice ahora es que cada M~ l AM tiene el 
mismo número de vectores característicos independientes que A (cada vector característi¬ 
co se multiplica por M ~ 1 ). 

El primer paso es considerar las transformaciones lineales que están detrás de las ma¬ 
trices. Rotaciones, reflexiones, y proyecciones actúan sobre el espacio «-dimensional. La 
transformación puede ocurrir sin álgebra lineal, aunque ésta resulta en multiplicación de 
matrices. 



Cambio de base = Transformación de semejanza 

La matriz semejante B — M~ l AM está estrechamente relacionada con A, si se regresa al es¬ 
tudio de las transformaciones lineales. Recuerde la idea clave: Toda transformación lineal 
está representada por una matriz. ¡La matriz depende de la elección de la base! Si la ba¬ 
se se cambia por M, entonces la matriz A se cambia por una matriz semejante B. 

Las matrices semejantes representan la misma transformación T respecto a bases 
diferentes. El álgebra es casi directa: Suponga que se tiene una base v u ..., v„. La y'-ésima 
columna de A se obtiene al aplicar T a vf. 

TVj = combinación de los vectores de la base = a\¡V\ + • • • + a nJ v n . (2) 


Para una nueva base V¡, , V„, la nueva matriz B se construye de la misma forma: TVj 

= combinación de los Vs — b\j Vj + ■ • • + b n ¡ V n . Pero también cada V debe ser una com¬ 
binación de los vectores de la base anterior: los V¡ = Esta matriz M en realidad 

representa la transformación identidad (!) cuando todo lo que ocurre es el cambio de base 
(T es I). La matriz inversa M~ l también representa la transformación identidad, cuando la 
base se cambia de los vs de regreso a los Vs. Así, la regla del producto proporciona el re¬ 
sultado que se busca: 


5Q Las matrices A y B que representan la misma transformación lineal T respecto 
a dos bases diferentes (los vs y los Vs) son semejantes: 


[Th . V =[/],. V 
B = M~~ l A M. 


(3) 


il M i V E R " í O D ¿ E O t ¡ "• !. O C i C A r-4 A CIONAL 

"5.6 Transformaciones de semejanza 295 

. : 

Sng. PC: .. . O:,-- ::r M DEL URUGUAV 

iZ. .X : i . ... i . ; -. ..j- - X— A. rí 1 z- ?' i i*¡N A , 

Considero que la mejor forma de explicar B = M~ l AM es con un ejemplo. Suponga 
que T es la proyección sobre la recta L al ángulo 9. Esta transformación lineal es descrita 
completamente sin ayuda de una base. Sin embargo, para representar T con una matriz se 
requiere de una base. En la figura 5.5 se presentan dos posibilidades, la base estándar 
i>[ = (1, 0), v 2 — (0, 1) y una base V¡, V 2 escogida especialmente para T. 



0 

1 


proyección 


-0.5 

0.5 


t'v 


0.5 —0.5 
—0.5 o.5 


proyección 



Figura 5.5 Cambio de base, con la finalidad de hacer diagonal a la matriz proyección. 


De hecho, TV X = V x (porque V¡ ya está en la recta L) y TV 2 = 0 (porque V 2 es per¬ 
pendicular a la recta). En esa base de vectores característicos, la matriz es diagonal: 

Base de vectores característicos B = [T]y a v — 

La otra cuestión es el cambio de matriz base M. Para ello, V¡ se expresa como una combi¬ 
nación v x eos 9 + v 2 sen 6 y estos coeficientes se escriben en la columna 1. De manera se¬ 
mejante, V 2 (o TV 2 , la transformación es la identidad) es — v t sen 9 + v 2 eos 9, con lo que 
se obtiene la columna 2: 


1 0 
0 0 


Cambio de base 


M = [/]» 


La matriz inversa M 1 (que aquí es la traspuesta) va de v a V. Combinada con B y M, pro¬ 
porciona la matriz proyección en la base estándar de us: 


Base estándar 


MBM~ 


c 

es 


es 

<■2 


Es posible resumir la cuestión importante. La manera de simplificar la matriz A —de 
hecho diagonalizarla— significa encontrar sus vectores característicos. Éstos van en las co¬ 
lumnas de M (o de S) y M~ l AM es diagonal. El algebrista afirma lo mismo en el lenguaje 
de las transformaciones lineales: escoger una base que conste de vectores característicos. 
La base estándar llevó a A, lo cual no era sencillo. La base correcta condujo a B, que era 
diagonal. 

Nuevamente se recalca que M~ l AM no surge cuando se resuelve Ax = b. Ahí la ope¬ 
ración básica fue multiplicar A (¡sólo por el lado izquierdo!) por una matriz que resta un 
múltiplo de un renglón de otro. Esta transformación preserva el espacio nulo y el espacio 
renglón de A: normalmente cambia los valores característicos. 

En realidad, los valores característicos se calculan por medio de una sucesión de se¬ 
mejanzas. La matriz avanza poco a poco hacia una forma triangular, y los valores caracte¬ 
rísticos aparecen de manera gradual sobre la diagonal principal. (Esta sucesión se describe 


a v 
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en el capítulo 7). Eso es mucho mejor que tratar de calcular det ( A — XI), cuyas raíces de¬ 
ben ser los valores característicos. Para una gran matriz, numéricamente es imposible con¬ 
centrar toda esta información en el polinomio y obtenerla de nuevo. 


Formas triangulares con una M unitaria 

Nuestro primer movimiento más allá de la matriz vector característico M — S es un poco 
ilógico: en vez de una M más general, se avanza en dirección opuesta y M se restringe de 
modo que sea unitaria. Con esta restricción, M~ X AM puede alcanzar una forma T triangu¬ 
lar. Las columnas de M = U son ortonormales (en el caso real podría escribirse M = Q). 
A menos que los vectores característicos de A sean ortogonales, una diagonal U~ 1 AU es 
imposible. Sin embargo, el “lema de Schur” en 5R es muy útil, por lo menos para la teo¬ 
ría. (El resto de este capítulo está dedicado más a la teoría que a aplicaciones. La forma de 
Jordán es independiente de esta forma triangular). 

5R Hay una matriz unitaria M = U tal que U~ X AU = T es triangular. Los valores 
característicos de A aparecen a lo largo de la diagonal de esta matriz semejante T. 

Demostración Toda matriz, por ejemplo de 4 por 4, tiene por lo menos un valor caracte¬ 
rístico A.,. En el peor de los casos, puede estar repetido cuatro veces. En consecuencia, A 
tiene por lo menos un vector característico unitario x u que se coloca en la primera colum¬ 
na de U. En esta etapa, es imposible determinar las otras tres columnas, por lo que la ma¬ 
triz se completa de cualquier forma que la deje unitaria, y se la denomina U¡. (El proceso 
de Gram-Schmidt garantiza que esto es posible). Ax¡ = en la columna 1 significa que 
el producto U¡~ 1 AU¡ empieza de forma correcta: 


AUi = U i 


A * * * 
0 * * * 
0 * * * 
0 * * * 


conduce a t/, Atlj = 


Luego, se trabaja con la submatriz de 3 por 3 en la esquina inferior derecha. Tiene un 
vector característico unitario x 2 , que se vuelve la primera columna de una matriz unitaria M 2 : 


entonces U 2 '(i/, X AU\)U 2 = 


A * * 

0 A.2 * 

0 0 * 

0 0 * 


En el último paso, un vector característico de la matriz de 2 por 2 en la esquina inferior de¬ 
recha pasa a una M 3 unitaria, que se coloca en la esquina de U 3 : 


Triangular XJ~ 1 ( U 2 1 U~ x AU l U 2 )U 3 


0 X 2 * * 
0 0 A 3 * 
0 0 0 * 


El producto U — U-JJ 2 U 3 sigue siendo una matriz unitaria, y U~ l AU = T. ■ 

Este lema es válido para todas las matrices, sin la hipótesis de que A es diagonaliza- 
ble. Puede usarse para demostrar que las potencias de A k tienden a cero cuando todos los 
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Ejemplo 2 


|X, | < I, y las exponenciales e A ‘ tienden a cero cuando todos los Re < 0, incluso sin 
el conjunto completo de vectores característicos que se supuso en las secciones 5.3 y 5.4. 

’2 — 1 ] 

A = ^ q tiene el valor característico X = 1 (dos veces). 


La única línea de vectores característicos pasa por (1, 1). Después de dividir entre V2, es¬ 
ta es la primera columna de U, y la U~ l AU — T triangular tiene los valores característicos 
sobre su diagonal: 


U~ X AU = 


1A/2 

1A/2 


1 A/2 
-1/V2. 



1/V2 l/vT 
1A/2 -1/V2. 



= T. (4) 


Diagonalización de matrices simétricas y hermitianas 

Esta forma triangular mostrará que cualquier matriz simétrica o hermitiana —sin importar 
que sus valores característicos sean distintos o no — tiene un conjunto completo de vecto¬ 
res característicos ortonormales. Se requiere una matriz unitaria tal que U~ l AU sea diago¬ 
nal. El lema de Schur justamente acaba de encontrarla. Esta T triangular debe ser diagonal, 
ya que también es hermitiana cuando A = A H : 

T = T h (U~ 1 AU) h = Í7 H A H (Í/ -I ) H = U~ X AU. 

La matriz diagonal U~ l AU representa un teorema clave en álgebra lineal. 

5S (Teorema espectral Toda A simétrica real puede dieg e por una ma¬ 
triz ortogonal Q. Toda matriz hermitiana puede diag e por una matriz 

unitaria U. 

■ ' . (real) Q~ x AQ — A o bien, A = QAQ r 

(compleja) U~ l AU = A o bien, A = U AU H 
Las columnas.de Q (o de U) contienen vectores característicos ortonormales de A. 

Observación 1 En el caso simétrico real, los valores característicos y los vectores carac¬ 
terísticos son reales en cada paso. Así se obtiene una U unitaria real , que es una matriz or¬ 
togonal. 


Observación 2 A es el límite de matrices simétricas con valores característicos distintos. A 
medida que se tiende al límite, los vectores característicos permanecen perpendiculares. 
Esto puede fallar si A ¥= A r : 



eos 9 
senf? 


Cuando 9 -» 0, el único vector característico de la matriz no diagonalizable jj] o ] es [ o 

Ejemplo 3 El teorema espectral establece que esta A = A T puede diagonalizarse: 

‘0 1 0' 

A = 10 0 con valores característicos repetidos Xi = X 2 — 1 y X 3 = — 1. 

0 0 i 
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X = 1 tiene un plano de vectores característicos, y se escoge un par x t y * 2 ; 


jl[¡ 

ñ 

v 2 o 


Estas son las columnas de Q. Al separar A 
renglones se obtiene 

ro i oí [i i oí 


-1 para X-¡ 
0 


QAQ r en 3 columnas multiplicadas por 3 


10 0 
0 0 1 . 


0 0 0 


'0 0 0 ' 

+ a. 2 o 0 0 + A. 3 
.0 0 1 . 


Debido a que A., = X 2 , estas dos primeras proyecciones x¡xj y x 2 xj (cada una de ran¬ 
go 1) se combinan para proporcionar una proyección P, de rango 2 (sobre el plano de vec¬ 
tores característicos). Así, A es 


0 1 0 
1 0 o 
0 0 1 


X¡Pi +X3P3 =( + l) 


o o 1 


+ (-l) 


-2 0 


Toda matriz hermitiana con k valores característicos distintos tiene una descomposición 
espectral en A = X x P x + • ■ • + X k P k , donde P¡ es la proyección sobre el espacio carac¬ 
terístico para X¡. Debido a que hay un conjunto completo de vectores característicos, la su¬ 
ma de las proyecciones es igual a la identidad. Y como los espacios característicos son 
ortogonales, dos proyecciones producen cero: P¡ P¡ = 0. 

Se está muy cerca de responder una pregunta importante, por lo que se continúa: ¿Pa¬ 
ra qué matrices se cumple que T = A? ¡Todas las Ts simétricas, simétricas sesgadas y 
ortogonales son diagonales! Las matrices hermitianas, antihermitianas y unitarias, también 
están en esta clase. Corresponden a números en el eje real, el eje imaginario, y en la cir¬ 
cunferencia unitaria. Ahora se busca toda la clase, que corresponde a todos los números 
complejos. Las matrices se denominan “normales”. 

5T La matriz N es normal si conmuta con IV 11 : NN H — N H N . Para tales matrices, 
y no otras, la triangular T — U~ 1 NU es la diagonal A. Las matrices normales son 
exactamente 'aquellas que tienen un conjunto completo de vectores característicos 
ortonormales. ' : . f . A: . . v ' ■'■SHfiS 

Ciertamente, las matrices simétricas y las matrices hermitianas son normales: Si A = 
A h , entonces ambas AA H y A H A son iguales a A 2 . Las matrices ortogonales y las unitarias 
también son normales: ambas UÜ 11 y U H U son iguales a /. Para cualquier matriz normal 
bastan dos pasos: 

1. Si N es normal, también lo es la triangular T = IT X NU: 


tt h = v -i ¿vt/[/ H iv H ¡y = u~ l n n h u = ir 1 n h nu = u h n h uu~ 1 nu = r H r. 


2. ¡Una T triangular que sea normal debe ser diagonal! (Consulte los problemas 19 y 20 
al final de esta sección). 


iwarnira 


son las columnas de U, y son ortonormales. Éste es el buen caso. A continuación se regre¬ 
sa de las mejores matrices ( normales ) a las peores posibles ( defectuosas ). 


Normal 


Defectuosa 


La forma de Jordán 

Esta sección ha hecho su mejor esfuerzo a la vez que demandó que M sea una matriz uni¬ 
taria U. Se obtuvo M~ X AM en una forma triangular T. Ahora se retira esta restricción so¬ 
bre M. Se permite cualquier matriz, y el objetivo es hacer M~ l AM lo más diagonal posible. 

El resultado de este esfuerzo supremo para diagonalización es la forma de Jordán J. 
Si A tiene un conjunto completo de vectores característicos, se toma M = S y se llega a 
] = S" 1 AS = A. Así, la forma de Jordán coincide con la diagonal A. Esto es imposible 
para una matriz defectuosa (no diagonalizable). Para todo vector característico foliante, la 
forma de Jordán tiene un 1 justo arriba de su diagonal principal. Los valores característi¬ 
cos aparecen sobre la diagonal porque J es triangular. Y siempre es posible desacoplar va¬ 
lores característicos distintos. 

Lo único que puede (o no) requerir un 1 fuera de la diagonal en J es un A. repetido. 



5U Si A tiene s vectores característicos independientes, es semejante a una matriz 
con s bloques: 


Forma de Jordán j = M~'AM 


Cada bloque de Jordán J¡ es una matriz triangular que sólo tiene un valor caracterís¬ 
tico y un solo vector característico: 


Bloque de Jordán J¡ 


El mismo A., aparece en varios bloques, si tiene varios vectores característicos inde¬ 
pendientes. Dos matrices son semejantes si y sólo si comparten la misma forma de 
Jordán J. 


Muchos autores han hecho de este teorema el punto clímax de su curso de álgebra li¬ 
neal. Francamente, considero que esto es un error. Ciertamente es verdad que no todas las 
matrices son diagonalizables, y la forma de Jordán es el caso más general. Simplemente 
por ello, su construcción es técnica y extremadamente inestable. (Un ligero cambio en A 
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Ejemplo 4 


10 ], , 11 
, , conducen a J = n , ■ 

11 U 1 


Estas cuatro matrices tienen valores característicos 1 y 1 con sólo un vector caracte¬ 
rístico, de modo que J consta de un bloque. A continuación se comprobará este hecho. To¬ 
dos los determinantes son iguales a 1. Las trazas (las sumas abajo de la diagonal principal) 
son igual a 2. Los valores característicos satisfacen l-l = lyl + l=2. Para T, B, y J, 
que son triangulares, los valores característicos están sobre la diagonal. Se quiere demos¬ 
trar que estas matrices son semejantes: todas pertenecen a la misma familia. 

(T) De T a J, la tarea es cambiar 2 a 1, y una matriz diagonal M lo hace: 

m-tm. r; 5in ?i -\i ¡w 


0 2j [0 lj [0 1 


(B) De B a J, la tarea es trasponer la matriz. Esto se obtiene con una permutación: 


P~ l BP = 


0 1 10 0 1 
10 11 10 


(A) De A a 7, primero se va a T como en la ecuación (4). Luego se cambia 2 a 1: 


U~ l AU 


q j = T y entonces M l TM = q j =7. 



'0 

1 

2" 

"0 

0 

r 

Ejemplo 5 

A = ,0 

0 

1 

y B = 0 

0 

0 


0 

0 

0 

0 

0 

0 


Ejemplo 6 


Cero es un triple valor característico de A y B, por lo que aparece en todos sus bloques de 
Jordán. Puede haber un solo bloque de 3 por 3, o un bloque de 2 por 2 y un bloque de 1 
por 1, o tres bloques de 1 por 1. Así, Ay B tienen tres posibles formas de Jordán: 


‘0 10 
Ji = 0 0 1 

0 0 0 


0 10 
0 0 0 
0 0 0 


0 0 0 

J 3 = 0 0 0 

0 0 0 


El único vector característico de A es (1, 0, 0). Su forma de Jordán sólo tiene un blo¬ 
que, y A debe ser semejante a J x . La matriz B tiene el vector característico adicional (0, 1, 
0), y su forma de Jordán es J 2 con dos bloques. Así como para J 3 = matriz cero, de suyo 
constituye una familia; la única matriz semejante a J 3 es M~ 1 0M = 0. Un conteo de los 
vectores característicos determina J cuando no hay nada más complicado que un valor ca¬ 
racterístico triple. 

Aplicación a ecuaciones en diferencias y ecuaciones diferenciales (potencias y exponen¬ 
ciales). Si A puede diagonalizarse, las potencias de A = SAS~ X son fáciles: A k = SA k S ~ 1 
. En cada caso se tiene la semejanza de Jordán A = M J Af~\ de modo que ahora se requie¬ 
ren las potencias de J: 

A k = (MJJM~~ l ) ■ ■ ■ (MJM~~ l ) = MJ k M~ l . 
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II 


J es diagonal por bloques, y las potencias de cada uno de estos bloques pueden tomarse por 
separado: 


~x 

1 

o] 4 

'X 4 

kx k ~ l 

\k(k - 1)X 4 ~ 2 ' 

0 

X 

1 

= 0 

x k 

kX k ~ l 

0 

0 

X 

0 

0 

X k 


Este bloque J¡ entra en juego cuando X es un triple valor característico con un solo vector 
característico. Su exponencial está en la solución de la ecuación diferencial correspondiente: 


Exponencial 


-\t 1 j.'I-X t 


[0 0 e k ‘ 

produce 1 + Xt + X 2 t 2 / 2! 4- 


( 10 ) 

e u en la dia- 


Aquí / 4- J¡t + (J¡t) 2 /21 + •■• produce 1 + Xt + X 2 t 2 / 2! + ••• = e u en la dia¬ 
gonal. 

La tercera columna de esta exponencial proviene directamente de resolver duldt = J¡u: 

^ Ui X 1 0 ui 0 

— u 2 = 0 X 1 «2 empezando con u 0 = 0 . 


Lo anterior puede resolverse por sustitución hacia atrás (ya que J¡ es triangular). La última 
ecuación du 3 /dt = Xu 3 produce u 3 = e x ‘. La ecuación para u 2 es du 2 /dt = Xu 2 + u 3 , 
y su solución es te x> . La ecuación de arriba es dujdt =Xu¡ + « 2 , y su solución es 
\t 2 e Xt . Cuando X tiene multiplicidad m con un solo vector característico, el factor adicio¬ 
nal t aparece m — 1 veces. 

Estas potencias y exponenciales de J forman parte de las soluciones u k y u(t). La otra 
parte es la M que relaciona la A original con la matriz más conveniente J: 

si u k+] = Au k entonces u k = A k u 0 = MJ k M~ l u 0 

si du/dt = Au entonces u(t) = e A, u( 0) = Me J, M~ x u{ 0). 

Cuando M y J son S y A (el caso diagonalizable) aquéllas son las fórmulas de las seccio¬ 
nes 5.3 y 5.4. El apéndice B regresa al caso no diagonalizable, y muestra cómo es posible 
alcanzar la forma de Jordán. Espero que la tabla siguiente sea un resumen conveniente. 

Transformaciones de semejanza 

1. A es diagonalizable : las columnas de S son vectores característicos y S~~ 1 AS = A. 

2. A es arbitraria: las columnas de Mí incluyen “vectores caracrerísdccs generaliza¬ 
dos” de A, y la forma de Jordán M~ l AM — J es diagonal por bloques. 

3. A es arbitraria : la matriz unitaria U puede .escogerse de tal manera que U~'A T J 

= Tes triangular. ' " : ■■ 

■ 4. A es normal, AA h — A H A: luego, U puede escogerse de modoque U~ X AU = Á. 

Casos especiales de matrices normales, todas con vectores característicos orto- 
normales: 

a) Si A = A h es hermitiana, entonces todos los Xs son reales. 

b) Sí A = A T es simétrica real, entonces A es real y U — Qes ortogonal. 

c) Si A = —A h es antihermitiana, entonces todos los X¡ son puramente imagi¬ 
narios. 

d) Si A es ortogonal o unitaria, entonces todos los ¡Á,[ = 1 están en la circunferen¬ 
cia unitaria. 
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|1 Conjunto de problemas 5.6 

1. Si B es semejante a A y C es semejante a B, demuestre que C es semejante a A. (Sean 
B — M~ I AM y C = N~ I BN.) ¿Qué matrices son semejantes a /? 

2. Describa con palabras todas las matrices que son semejantes a _ x j, y encuentre 
dos de ellas. 


3. 

4. 


5. 


Explique por qué A nunca es semejante a A + I. 

Encuentre una diagonal M integrada por Is y — ls, para demostrar que 



1 

2 

1 


1 

2 

1 


1 

2 


es semejante a 



Demuestre (si B es invertible) que BA es semejante a AB. 



6. á) Si CD — —DC (y D es invertible), demuestre que C es semejante a — C. 

b) Deduzca que los valores característicos de C deben presentarse por parejas más- 
menos. 

c) Demuestre directamente que si Cx = Xx, entonces C(Dx) = —X(Dx). 


7. Considere cualquier A y una “rotación dada” M en el plano 1-2: 


a 

b 

c 

eos 9 

—sen 9 

0' 

A ~ d 

e 

f 

, M = sen<9 

eos d 

0 

J 

h 

i 

L 0 

0 

1 


Escoja el ángulo de rotación 9 para obtener cero en el elemento (3, 1) de M ! AM. 

Nota Esta obtención “de ceros” no es fácil de continuar, ya que las rotaciones produ¬ 
cen cero en lugar de d y h arruina el nuevo cero en la esquina. Es necesario dejar una 
diagonal abajo de la principal, y terminar el cálculo de los valores característicos de 
alguna otra forma. En caso contrario, si A puede hacerse diagonal y pueden verse sus 
valores característicos, entonces se encontrarían las raíces del polinomio det (A — XI) 
usando sólo las raíces cuadradas que determinan eos 9; lo cual es imposible. 


8. ¿Qué matriz M cambia de la base V¡ = (1, 1), V 2 = (1, 4) a la base v x = (2, 5), v 2 = 
(1, 4)? Las columnas de M se obtienen al expresar V¡ y V 2 como combinaciones 1m¡j_ 
v¡ de los v’s. 

9. Para las dos mismas bases, exprese el vector (3, 9) como una combinación c¡V¡ + 
c 2 V 2 y también como d x v x + d 2 v 2 . Compruebe numéricamente que M relaciona c con 
d: Me = d. 


10. Confirme el último ejercicio: Si V x = m xx v x + m 2X v 2 y V 2 = m x2 v x + m 22 v 2 , y 
m n c\ 4- m X2 c 2 = di y m 2 \c x + m 22 c 2 = d 2 , los vectores c x V x + c 2 V 2 y d x v x + d 2 v 2 
son los mismos. Esta es la “fórmula de cambio de base” Me = d. 


11. Si la transformación T es una reflexión, a través de la recta a 45° en el plano, encuen¬ 
tre su matriz respecto a la base estándar v t = (1, 0), v 2 = (0, 1), y también respecto a 
V x = (1, 1), V 2 = (1, — 1). Demuestre que estas matrices son semejantes. 


12. La transformación identidad lleva cada vector en sí mismo: Tx = x. Encuentre la ma¬ 
triz correspondiente, si la primera base es v x = (1, 2), v 2 = (3, 4) y la segunda base 
es w x = (1, 0), w 2 = (0, 1). (¡No es la matriz identidad!) 
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13. La derivada de a + bx + cx 2 es b + 2 cx + Ox 2 . 
a) Escriba la matriz de D3 por 3 tal que 



tí) Calcule D 3 , e interprete los resultados en términos de derivadas. 
c) ¿Cuáles son los valores característicos y los vectores característicos de DI 

14. Demuestre que todo número es un vector característico para Tf(x) = df/dx, pero 
que la transformación Tf(x ) = f(t) dt no tiene valores característicos (aquí 
—oo < x < oo). 

15. En el espacio de matrices de 2 por 2, sea T la transformación que traspone cada ma¬ 
triz. Encuentre los valores característicos y las “matrices características” para A T = 
XA. 

16. a) Encuentre una matriz ortogonal Q, de modo que Q~ l A Q — A si 


'1 

1 

r 

'0 

0 

0' 

1 

1 

1 y 

A = 0 

0 

0 

1 

1 

1 

0 

0 

3 


Luego, encuentre un segundo par de vectores ortonormales x¡, x 2 para A. = 0. 
b ) Compruebe que P = x x xj + x 2 xj es el mismo para ambos pares. 

17. En dos pasos, demuestre que toda matriz unitaria A es diagonalizable: 

i) Si A es unitaria, y U también lo es, entonces T = U~ l AU también es unitaria. 

ii) Una T triangular superior que es unitaria debe ser diagonal. Así, T — A. 

Cualquier matriz unitaria A (con valores característicos distintos o no) tiene un con¬ 
junto completo de vectores característicos ortonormales. Todos los valores caracterís¬ 
ticos satisfacen |A.| — 1. 

18. Encuentre una matriz normal (AW H = N H N) que no sea hermitiana, antihermitiana, uni¬ 
taria, o diagonal. Demuestre que todas las matrices permutación son normales. 

19. Suponga que T es una matriz triangular superior de 3 por 3, con elementos ty. Com¬ 
pare los elementos de 7T H y T H T, y demuestre que si son iguales, entonces T debe ser 
diagonal. Todas las matrices triangulares normales son diagonales. 

20. Si N es normal, demuestre que ||lVx|| = ||íV H x|| para todo vector x. Deduzca que el 
í-ésimo renglón de N tiene la misma longitud que la i-ésima columna. Nota: Si N tam¬ 
bién es triangular superior, esto de nuevo lleva a la conclusión de que debe ser dia¬ 
gonal. 

21. Demuestre que una matriz con vectores característicos ortonormales debe ser normal, 
como se establece en 5T: Si U~ V NU = A, o N = UAU H , entonces NN H = N H N. 

22. Encuentre una U unitaria y una T triangular de modo que U~~ l AU = T, para 



_ 'l ' 

"0 

1 

0' 

a 3 

A ~ [4 

-2 

y A = 0 

0 

0 



1 

0 

0 


23. Si A tiene valores característicos 0, 1,2, ¿cuáles son los valores característicos de 
A(A - I)(A -21)1 
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24. a) Demuestre por multiplicación directa que toda matriz triangular T, por ejemplo de 3 

por 3, satisface su propia ecuación característica (T — X\I)(T — X 2 I)(T— 
A. 3 /) = 0. 

b ) Sustituya U~ X AU por T para deducir el famoso teorema de Cayley-Hamilton: To¬ 
da matriz satisface su propia ecuación característica. Para las matrices de 3 por 3, 
esto es (A — X\I)(A — X 2 I)(A — X 3 I) — 0. 

25. El polinomio característico de A = b d j es A 2 — (a + d)X + (ad — be). Por sus¬ 
titución directa, compruebe el teorema de Cayley-Hamilton: A 2 — (a + d) A + 
(ad — bc)I = 0. 

26. Si a¡j = 1 arriba de la diagonal principal y ay = 0 en todas partes, encuentre la forma 
de Jordán (por ejemplo, para matrices de 4 por 4) encontrando todos los vectores ca¬ 
racterísticos. 

27. Demuestre al tanteo para una M que ningunas tomadas dos a dos de las tres formas de 

Jordán en la ecuación (8) son semejantes: J\ f M~ x J 2 M, J, f y 

28. Resuelva u’ = Ju por sustitución hacia atrás, resolviendo primero para u 2 (t): 


du 

— = Ju 
dt 


con valor inicial «(0) 


Observe te 5 ' en la primera componente zq(í). 

29. Calcule A 10 y e* si A = MJM ~ X : 


30. Demuestre que Ay B son semejantes encontrando una M tal que B = M~ X AM: 


a) A = 


1 -1 
-1 1 ' 


31. ¿Cuáles de las siguientes matrices A { a A 6 son semejantes? 

'1 0] [0 1] Ti 1] [0 0] [1 0] [0 1' 

,° !J L 1 °J L° °J L 1 L 1 °J L° 1 ‘ 

32. Hay 16 matrices de 2 por 2 cuyos elementos son Os y ls. Las matrices semejantes per¬ 
tenecen a la misma familia. ¿Cuántas familias hay? ¿Cuántas matrices (en total 16) 
hay en cada familia? 

33. a) Si x está en el espacio nulo de A, demuestre que M~ x x está en el espacio nulo de 

M~ l AM. 

b) Los espacios nulos de A y M~ l AM tienen igual(es)(vectores)(bases)(dimensión). 

34. Si A y B tienen exactamente los mismos valores característicos y vectores caracterís¬ 
ticos, ¿es A = £? Con n vectores característicos independientes, se tiene A = B. En¬ 
cuentre A ¥= B cuando X = 0, 0 (repetido), aunque sólo hay una línea de vectores 
característicos (jq, 0). 


5.6 Transformaciones de semejanza 


Los problemas 35 a 39 son sobre la forma de Jordán. 

35. Por multiplicación directa, encuentre J 2 y J 3 cuando 

/-f: >1 


Conjeture la forma de J k . Haga k = 0 para obtener J°. Haga k = — 1 para obtener 
J~\ 

36. Si J es la matriz de Jordán por bloques de 5 por 5 con X = 0, encuentre J 2 y cuente 
sus vectores característicos. También encuentre su forma de Jordán (dos bloques). 

37. En el texto se resolvió du/dt = Ju para una matriz J de Jordán por bloques de 3 por 3. 
Agregue una cuarta ecuación dw/dt = 5iu+ x. Siga el patrón de soluciones para z, y, 
x con la finalidad de encontrar w. 

38. Los valores característicos de las siguientes matrices de Jordán son 0, 0, 0, 0. Las ma¬ 
trices tienen dos vectores característicos (encuéntrelos). Sin embargo, los tamaños de 
los bloques no coinciden y J no es semejante a K: 


'0 

1 

0 

0 ' 

0 

0 

0 

0 

0 

0 

0 

1 

0 

0 

0 

0 


‘0 

1 

0 

0 ' 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 


Para cualquier matriz M, compare JM con MK. Si son iguales, demuestre que M no es 
invertible. Luego, M~ X JM = K es imposible. 

39. Demuestre en tres pasos que A T siempre es semejante a A (se sabe que los Xs son los 
mismos; el problema son los vectores característicos): 

a) Para A = un bloque, encuentre M¡ = permutación tal que M ~ 1 M¡ = 7?. 

b) Para A = J cualquiera, construya M 0 , a partir de bloques, de modo que Mf l J Mr, 
= J T . 

c) Para cualquiera A = M JM~ x , demuestre que A T es semejante a J T y que también 
es semejante a J y a A. 

40. ¿Cuáles de los siguientes pares son semejantes? Escoja a, b, c, d para demostrar que 
los otros pares no lo son: 


41. ¿Falso o verdadero (proporciona una buena razón)? 

a) Una matriz invertible no puede ser semejante a una matriz singular. 

b) Una matriz simétrica no puede ser semejante a una matriz no simétrica. 

c) A no puede ser semejante a —A, a menos que A = 0. 

d) A — I no puede ser semejante a A + I. 

42. Demuestre que A B tiene los mismos valores característicos que BA. 

43. Si A es de 6 por 4 y B es de 4 por 6, AB y BA son de tamaños distintos. No obstante. 


AB 0 
B 0 


0 0 
B BA 


a ) ¿De qué tamaño son los bloques de G? Son los mismos en cada matriz. 

b) Esta ecuación es M~~ X FM = G, de modo que F y G tienen los mismos 10 valores 
característicos. F tiene los valores característicos de AB más 4 ceros; G tiene los 
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valores característicos de BA más 6 ceros. AB tiene los mismos valores característi¬ 
cos que BA más ___ ceros. 

44. ¿Por qué cada una de las siguientes afirmaciones es verdadera? 

a) Si A es semejante a B, entonces A 2 es semejante a B 2 . 

b) A 2 y B 2 pueden ser semejantes cuando A y B no son semejantes (intente A = 0, 0). 

c) [l ° j es semejante a j^o ¿j. 

d) ^ o 31 no es semejante a £ l 3 j. 

e) Si se intercambian los renglones 1 y 2 de A, y luego se intercambian las columnas 
1 y 2 , los valores característicos siguen siendo los mismos. 

Propiedades de ios valores característicos y vectores característicos 

¿Cómo se reflejan las propiedades de una matriz en sus valores característicos y vectores 
característicos? Esta cuestión es fundamental en todo el capítulo 5. Una tabla que organi¬ 
ce los hechos más importantes puede ser de utilidad. Para cada clase de matrices, a conti¬ 
nuación se presentan las propiedades especiales de los valores característicos A¡ y los 
vectores característicos x¡. 


Simétrica: A T = A 

X real 

ortogonal xjxj — 0 

Ortogonal: Q r = Q~ l 

toda|X| = 1 

ortogonal xfxj = 0 

Simétrica sesgada: A T = —A 

A imaginaria 

ortogonal xjxj = 0 

—T 

Hermitiana compleja: A = A 

A real 

ortogonal x]x¡ = 0 

Definida positiva: x T Ax >0 

toda A > 0 


Matriz similar: B = M~ l AM 

A(B) = X(A) 

x(B) = M~ x x{A) 

Proyección: P = P 2 = P T 

X = 1; 0 

espacio de columna; espacio nulo 

Reflexión: / — 2 uu T 

X = -1; 1,..., 1 

U'.U 1 - 

Matriz rango 1: uv T 

X = v T u; 0,... ,0 

u; v x 

Inversa: A -1 

1/X( A) 

vectores característicos de A 

Corrimiento: A + el 

X(A) + c 

vectores característicos de A 

Potencias estables: A n —* 0 

toda 1XJ < 1 


Exponencialmente estable: e At — 

► 0 toda Re X < 0 


Markov: m¡j > 0, Y'* = , m¡¡ = 1 

^•máx = 1 

estado estacionario x > 0 

Permutación cíclica: P n = / 

A k = ¿ UikJn 

x, = (Ub-.xr 1 ) 

Diagonalizable: SAS~ l 

diagonal de A 

las columnas de S son independientes 

Simétrica: QAQ} 

diagonal de A (real) 

las columnas de Q son ortonormales 

Jordán: J = M~ l AM 

diagonal de J 

cada bloque de un vector característico 

Cada matriz: A = I/SV T 

rango (A) = rango (E) 

los vectores característicos de 


A t A, AA t en V, U 


Ejercicios de repaso 


Capítulo 


Ejercicios de repaso 


5.1 Encuentre los valores característicos, los vectores característicos, y la matriz de dia- 
gonalización S, para 


y B 


7 2 

-15 -4 


5.2 Encuentre los determinantes de A y A 1 si 


_ A-i 2 1 

[ 0 X 2 J 5 ‘ 

5.3 Si A tiene los valores característicos 0 y 1, correspondientes a los vectores caracterís¬ 
ticos 


¿podría decir de antemano que A es simétrica? ¿Cuáles son su traza y su determinan¬ 
te? ¿Cuál es A? 

5.4 En el problema previo, ¿cuáles son los valores característicos y los vectores caracte¬ 
rísticos de A 2 ? ¿Cuál es la relación de A 2 con A? 

5.5 ¿Existe una matriz A tal que toda la familia A + el es invertible para todos los núme¬ 
ros complejos c? Encuentre una matriz real con A + rl invertible para todo r real. 

5.6 Resuelva para los dos valores iniciales, y luego encuentre e At : 


u si u( 0) 


y si k(0) 


5.7 ¿Prefiere un interés compuesto trimestralmente a 40% anual o anualmente a 50%? 

5.8 ¿Falso o verdadero? (Proporcione un contraejemplo si es falso): 

a) Si B se forma a partir de A, mediante el intercambio de dos renglones, entonces B 
es semejante a A. 

b ) Si una matriz triangular es semejante a una matriz diagonal, ya es diagonal. 

c) Cualesquiera de las dos afirmaciones anteriores implica la tercera: A es hermitia- 
na, A es unitaria, A 2 = I. 

d) Si Ay B son diagonalizables, entonces también lo es A B. 

5.9 ¿Qué ocurre a la sucesión de Fibonacci si se retrocede en el tiempo, y cómo está re¬ 
lacionado F- k con F k 7 La ley F k+2 = F k+1 + F k sigue siendo válida, de modo que 
F-i = 1 . 

5.10 Encuentre la solución general de duldt = Au si 

'0 -1 0' 

A = 1 0 -1 . 

0 1 0_ 

¿Puede encontrar un instante T al que se garantice que la solución u{T) vuelva al va¬ 
lor inicial u( 0)? 
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5.11 Si P es la matriz que proyecta R" sobre un subespacio S, explique por qué todo vec¬ 
tor en S es un vector característico, y así como cada vector en S 2- . ¿Cuáles son los va¬ 
lores característicos? (Observe la relación con P 2 = P, lo que significa que X 2 = X.) 

5.12 Demuestre que toda matriz de orden > 1 es la suma de dos matrices singulares. 

5.13 a) Demuestre que la ecuación diferencial matricial dX/dt = AX + XB tiene la solu¬ 

ción X(t) = e Al X(0)e B ‘. 

b ) Demuestre que las soluciones de dX/dt = AX — XA preservan los mismos valores 
característicos para todos los instantes. 

5.14 Si los valores característicos de A son 1 y 3 con vectores característicos (5, 2) y (2,1), 
encuentre las soluciones de du/dt — Au y u k +¡ — Au k , empezando con u (9, 4). 

5.15 Encuentre los valores característicos y los vectores característicos de 


[0 -i Oj 

¿Qué propiedad se espera tengan los vectores característicos y es verdadera? 

5.16 Intente resolver lo siguiente para demostrar que A no tiene raíz cuadrada. 

a b a b _ 0 1 _ . 

c d c d 0 0 


Cambie los elementos en la diagonal de A a 4 y encuentre una raíz cuadrada. 

5.17 a ) Encuentre los valores característicos y los vectores característicos de A = [ ? g ] ■ 

b) Resuelva du/dt = Au empezando con w(0) = (100, 100). 

c) Si v(t) — ganancia de los corredores de bolsa y w{t) = ganancia del cliente, y am¬ 
bos se ayudan mutuamente mediante dv/dt = 4w y dw/dt =|v,¿a que tiende la 
razón v/w cuando t —»co? 

5.18 ¿Falso o verdadero? (Proporcione una razón si es verdadero y un contraejemplo si es 
falso). 

a) Para toda matriz A, hay una solución de du/dt = Au empezando con n(0) = 

(1. • • • , D- 

b ) Toda matriz invertible puede diagonalizarse. 

c) Toda matriz diagonalizable puede invertirse. 

d) El intercambio de los renglones de una matriz de 2 por 2 invierte el signo de sus 
valores característicos. 

é) Si los vectores característicos xy y corresponden a valores característicos distin¬ 
tos, entonces = 0. 

5.19 Si K es una matriz simétrica sesgada, demuestre que Q = (/ - K)(I + K)~ 1 es una ma- 

[ 0 21 
-2 Oj' 

5.20 Si K H = -K (hermitiana sesgada), los valores característicos son imaginarios y los 
vectores característicos son ortogonales. 

a) ¿Cómo se sabe que K — le s invertible? 

b)' ¿Cómo se sabe que K = UAU H para una matriz U unitaria? 


Ejercicios de repaso 
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c ) ¿Por qué es unitaria e Ar ? 

d) ¿Por qué es unitaria e K “l 

5.21 Si M es la matriz diagonal con elementos d, d 2 , d 3 , ¿cuál es ¿Cuáles son sus 

valores característicos en el siguiente caso? 

1 11' 

111. 

1 1 1_ 

5.22 Si A 2 = — I, ¿cuáles son los valores característicos de A? Si A es una matriz real de n 
por n, demuestre que n debe ser par, y proporcione un ejemplo. 

5.23 Si Ax = X { x y A T y = X 2 y (todos reales), demuestre que x T y = 0. 

5.24 Una variante de la matriz de Fourier es la “matriz seno”: 

, fsen0 sen 20 sen 38 

1 7T 

S = —= sen 20 sen 40 sen 60 con 0 = —. 
sen 30 sen 60 sen 90 

Compruebe que S T = S~ l . (Las columnas son los vectores característicos de la ma¬ 
triz tridiagonal —1,2, — 1). 

5.25 a) Encuentre una matriz N diferente de cero tal que N 3 — 0. 

b) Si Nx = Xx, demuestre que X debe ser cero. 

c) Demuestre que N (denominada “matriz nilpotente”) no puede ser simétrica. 

5.26 a) Encuentre la matriz P = aa T /a T a que proyecta cualquier vector sobre la recta que 

pasa por a = (2, 1, 2). 

b) ¿Cuál es el único valor característico diferente de cero de P, y cuál es el vector ca¬ 
racterístico correspondiente? 

c) Resuelva u k+l — Pu k , empezando con u 0 = (9, 9, 0). 

5.27 Suponga que el primer renglón de A es 7, 6 y que sus valores característicos son i, —i. 
Encuentre A. 

5.28 a) ¿Para qué números c y d ocurre que A tiene valores característicos reales y vecto¬ 

res característicos ortogonales? 

'1 2 0' 

A = 2 d c . 

_0 5 3_ 

b) ¿Para cuáles c y des posible encontrar tres vectores ortonormales que sean com¬ 
binaciones de las columnas? (¡No lo resuelva!) 

5.29 Sí los vectores x¡ y x 2 están en las columnas de S, ¿cuáles son los valores caracterís¬ 
ticos y los vectores característicos de 

°]s-' y 

530 ¿Cuál es el límite cuando k —> oo (el estado estacionario de Markov) de í o’e o '7 ] [*]? 
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Matrices positivas definidas 


E 6.1 MÍNIMOS, MÁXIMOS, Y PONTOS SILLA 

Hasta el momento, difícilmente se ha pensado en los signos de los valores característicos. 
No es posible preguntar si X es positivo antes de saber si es real. En el capítulo 5 se esta¬ 
bleció que toda matriz simétrica tiene valores característicos reales. A continuación se 
encontrará una prueba que puede aplicarse directamente a A, sin calcular sus valores carac¬ 
terísticos, que garantizará que todos estos valores característicos son positivos. Esta prue¬ 
ba conlleva tres de los conceptos más importantes del libro: pivotes , determinantes y 
valores característicos. 

A menudo, el signo de los valores característicos es crucial. Para estabilidad en ecua¬ 
ciones diferenciales, se requieren valores característicos negativos, de modo que e Xr decai¬ 
ga. El nuevo y muy importante nuevo problema es reconocer un punto mínimo. Esto se 
presenta en toda la ciencia e ingeniería, así como en todo problema de optimización. El pro¬ 
blema matemático es mover la prueba de la segunda derivada F" > 0 hacia n dimensiones. 
A continuación se presentan dós bjemplos: 

F(x, y) = 7 + 2(x + y) 2 — yseny — x 3 f(x, y) — 2x 2 4- 4xy 4- y 2 . 

Ya sea F(x, y) o /(x, y), itiene un punto mínimo en x = y = 0? 

Observación 1 Los términos de orden cero FÍO, 0) = 7 y /(O, 0) = 0 no afectan la res¬ 
puesta. Simplemente suben o bajan las gráficas de F y /. 

Observación 2 Los términos lineales proporcionan una condición necesaria: A fin de 
tener alguna posibilidad de un mínimo, las primeras derivadas deben hacerse cero en 
x — y = 0: 

9F dF 

- = 4(x + y) — 3x 2 = 0 y —— = 4(x + y) — y eos y —seny = 0 

dx dy 

9/ 9/ 

— = 4x + 4y = 0 y —- = 4x 4- 2y = 0. Todo cero, 
dx dy 

Así, (x, y) — (0, 0) es un punto estacionario para ambas funciones. La superficie z = F(x, 
y) es tangente al plano horizontal z = 7, y la superficie z — f(x, y) es tangente al plano 
z = 0. La cuestión es si las gráficas pasan o no por arriba de esos planos , a medida que 
se aleja el punto de tangencia x = y — 0. 
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Estas segundas derivadas 4, 4, 2 contienen la respuesta. Debido a que son las mismas pa¬ 
ra F y para/, deben contener la misma respuesta. Las dos funciones se comportan exac¬ 
tamente de la misma manera cerca del origen. F tiene un mínimo si y sólo si f tiene un 
mínimo. ¡Se demostrará que estas funciones no lo hacen! 

Observación 4 Los términos de orden superior en F no afectan la cuestión de un mí¬ 
nimo local , aunque pueden impedir que éste se convierta en un mínimo global. En el 
ejemplo, el término —x 3 tarde o temprano empujará a F hacia — oo. Para f(x, y), sin tér¬ 
minos superiores, toda la acción está en (0, 0). 

Toda forma cuadrática f = cu 2 + 2bxy + cy 2 tiene un punto estacionario en el ori¬ 
gen, donde df/dx = df/dy = 0. Un mínimo local también debe ser un mínimo global. 
Entonces, la forma de la superficie z = /(x, y) es como la de un tazón, apoyado en el ori¬ 
gen (véase la figura 6.1). Si el punto estacionario de F está en x — a, y = /3, el único 
cambio es en el uso de las segundas derivadas en a, ]3: 


Parte 

cuadrática 

deF 


/(*> y) 


’ 3 2 F y 2 3 2 F 

* ( “’ /,)+Jcy ¿^ (a ’ /S) + TW (a ’ p) ' 


(i) 


Cerca de (0, 0), está/(x, y), y se comporta de la misma forma en que F(x, y) se compor¬ 
ta cerca de (a, j3). 


Las terceras derivadas hacen su aparición en el problema cuando las segundas deriva¬ 
das fracasan en proporcionar una decisión definitiva. Esto ocurre cuando la parte cuadrá¬ 
tica es singular. Para un mínimo verdadero, se permite que/sea cero sólo en x = y = 0. 
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Cuando/(x, y) es estrictamente positiva en todos los demás puntos (el cuenco del tazón 
está hacia arriba), se denomina positiva definida. 

Definida contra indefinida: tazón contra silla 

El problema se reduce a lo siguiente: Para una función de dos variables xy y, ¿cuál es la 
sustitución correcta para la condición 3 2 F/3 x 2 > 0? Con una sola variable, el signo de 
la segunda derivada decide entre un mínimo o un máximo. Ahora se cuenta con tres se¬ 
gundas derivadas: F**, F v = F yx , y Fyy. Estos tres números (como 4, 4, 2) deben deter¬ 
minar si F (igual que/) tiene o no un mínimo. 

¿Qué condiciones sobre a, b y c aseguran que la cuadrática f(x,y ) = ax 2 + 2bxy 
+ cy 2 es positiva definida ? Una condición necesaria es fácil: 

i) Si ax 2 + 2bxy + cy 2 es positiva definida, entonces necesariamente a > 0. 

Se considera x — 1, y — 0, donde ax 2 + 2 bxy + cy 2 es igual a a. Ésta debe ser positiva. 
Trasladando de vuelta a F, lo anterior significa que 3 2 F/3 x 2 > 0. La gráfica debe ser 
hacia arriba en la dirección x. De manera semejante, se fija x = 0 y se considera la di¬ 
rección y, donde/(0, y) = cy 2 : 

ii) Si f(x, y) es positiva definida, entonces necesariamente c > 0. 

¿Estas condiciones sobre a > 0 y c > 0 garantizan que/(x, y) siempre es positiva? La res¬ 
puesta es no. Un gran término cruzado 2bxy puede empujar la gráfica por abajo de cero. 

Ejemplo 1 /(x, y) = x 2 - lOxy + y 2 . Aquí a — 1 y c = 1 son ambas positivas. Sin embargo, /no es po¬ 

sitiva definida, ya que /(1, 1) = —8. Las condiciones a > 0 y c > 0 aseguran que /(x, y) 
es positiva en los ejes xy y. Pero la función es negativa sobre la recta x — y, porque b = 
—10 supera a a y c. 

Ejemplo 2 En la /original, el coeficiente 2¿> = 4 era positivo. ¿Esto asegura un mínimo? De nue¬ 
vo la respuesta es no; ¡el signo de b carece de importancia! Aunque sus segundas deri¬ 
vadas son positivas, 2x z + 4xy + y 2 no es positiva definida. Ni F nif tienen un mínimo 

en (0, 0) porque /(1, —1) = 2 — 4 + 1 = —1. 

Lo que debe controlarse es el tamaño de b, en comparación con a y c. Ahora se 
quiere una condición necesaria y suficiente para la condición de positiva definida. La téc¬ 
nica más simple es completar el cuadrado: 

Expresar/(x, y) , b \ 2 / b 2 '\ 

usando / = ax 2 + 2bxy + cy 2 = a I x H—y J + ( c-- j y 2 . (2) 

cuadrados ' a ' ~ a ' 

El primer término a la derecha nunca es negativo, cuando el cuadrado se multiplica por 
a > 0. Pero este cuadrado puede ser cero, y entonces el segundo término debe ser posi¬ 
tivo. El coeficiente de ese término es ( ac - b 2 )/a. El último requerimiento para la condi¬ 
ción de positiva definida es que este coeficiente debe ser positivo: 

iii) Si ax 2 + 2bxy + cy 2 permanece positiva, entonces necesariamente ac > b“. 
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Prueba para un mínimo: Las condiciones a> 0 y ac > b 2 son conectas. Garantizan c > 0. 
El miembro derecho de (2) es positivo, y se ha encontrado un mínimo: 

6A ax 2 + 2 bxy + cy 2 es positiva definida si y solo si a > 0 y ac > b 2 . Cualquier 
F(x, y) tiene un mínimo en un punto donde BF/'óx = 3F/3y =0 con 



Prueba para un máximo: Debido a que / tiene un máximo siempre que —f tiene un mí¬ 
nimo, simplemente se invierten los signos de a, b y c. Esto en realidad deja ac > b 2 sin 
cambio: la forma cuadrática es negativa definida si y sólo si a < 0 y ac > b 2 . El mismo 
cambio es válido para un máximo de F(x, y). 

Caso singular ac = b z : El segundo término en la ecuación (2) desaparece para dejar só¬ 
lo el primer cuadrado, que es positivo semidefinido, cuando a > 0, o negativo semidefini- 
do, cuando a < 0. El prefijo semi permite la posibilidad de que F pueda ser igual a cero, 
como es el caso en el punto x = b, y = —a. La superficie z = f(x, y) degenera de un tazón 
en un valle. Para f — (x + y) 2 , el valle se encuentra a lo largo de la recta x + y — 0. 

Punto silla ac < b z : En una dimensión, F(x) tiene un mínimo o un máximo, o bien, 
F" = 0. En dos dimensiones, permanece una posibilidad bastante importante: la combina¬ 
ción ac - b 2 puede ser negativa. Esto ocurrió en los dos ejemplos, cuando b dominaba a a 
y c. Esto también ocurre si a y c tienen signos opuestos. Así, dos direcciones proporcionan 
resultados opuestos: en una dirección, /crece; en la otra, decrece. Resulta de utilidad con¬ 
siderar dos casos especiales: 

Puntos silla en (0,0) f l =2xy y / 2 =x 2 -y 2 y ac-b 2 — -\. 

En el primero, b = 1 domina a = c = 0. En el segundo, a — 1 ye = —1 tienen signos 
opuestos. Los puntos silla 2 xy y x 2 - y 2 son prácticamente los mismos; si uno se hace gi¬ 
rar 45°, se obtiene el otro. También es difícil trazarlos. 

Estas formas cuadráticas son indefinidas , porque pueden asumir cualquier signo. Así, 
se tiene un punto estacionario que no es máximo ni mínimo. Se denomina punto silla. La 
superficie z = x 2 - y 2 va hacia abajo en la dirección del eje y, donde sus piernas se ajustan 
(si usted ha montado a caballo). En caso de que usted haya cambiado a un automóvil, pien¬ 
se en una carretera que va por un paso de montaña. La cima del paso es un mínimo mien¬ 
tras se observa a lo largo de la cordillera, aunque es un máximo cuando usted avanza por 
la carretera. 

Dimensiones superiores: álgebra lineal 

El cálculo podría bastar para encontrar nuestras condiciones F xx > 0 y F xx F yy > F 2 y 
para un mínimo. Sin embargo, el álgebra lineal está preparada para hacer más, ya que las 
segundas derivadas se ajustan a una matriz simétrica A. Los términos ax 2 y cy 2 aparecen 
sobre la diagonal. La derivada cruzada 2 bxy está separada entre el mismo elemento b arri- 
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Ba 3 f%6ájÓ. ¡Una cuadrática/(x, ^) : grq«eneffiéé@niMte31h»8na matriz simétrica de 2 por 2! 

x T AxenR 2 ax 2 +2bxy + cy 2 = [x y] ^ ^ x . (4) 

Esta identidad (por favor, realice el producto) constituye la clave para todo el capítu¬ 
lo. Se generaliza de inmediato a n dimensiones, y constituye una abreviación perfecta pa¬ 
ra estudiar máximos y mínimos. Cuando las variables son x¡, . . . , x„, van en un vector 
columna x. Para cualquier matriz simétrica A, el producto x T Ax es una forma cuadráti¬ 
ca pura f(x v — , x„): 

a¡, a\2 

x T Ax enR” [xi x 2 • x„] ° 21 ° 22 

~Ct n { U n 2 

Los elementos diagonales a n a a nn multiplican x 2 y x 2 • El par a,y = a yY se combina en 

2a ij x i Xj. Así, / = a¡¡xf + 2ai2XtX 2 + • • • + a nn x 2 . 

No hay términos de orden superior ni términos de orden inferior; sólo de segundo or¬ 
den. La función es cero en x = (0,..., 0), y sus primeras derivadas son cero. La tangente 
es plana; se trata de un punto estacionario. Es necesario decidir si x = 0 es un mínimo, un 
máximo o un punto silla de la función / = x T Ax. 

Ejemplo 3 ^ 4. 4 X y + y 2 y A = ^ ^ -*■ punto silla. 

Ejemplo 4 y = 2xy y A = ^ q —^ punto silla. 



Ejemplo 5 A es de 3 por 3 para 2xf - 2x¡x 2 + 2x\ - 2x 2 x 3 + 2xf: 

2—1 0 xi 

/ = [xi x 2 x 3 ] — 1 2 -1 x 2 -*• mínimo en (0,0,0). 

0—1 2 x 3 

Cualquier función F(x u .... x„) es aproximada de la misma forma. En un punto esta¬ 
cionario todas las primeras derivadas son cero. A es la “matriz segunda derivada” con ele¬ 
mentos a¡j = d 2 FldXidx¡- Esto automáticamente es igual a a,-¡ = 3 2 F/3x/3x ; , de modo 
que A es simétrica. Así, F tiene un mínimo cuando la cuadrática pura x T Ax es positiva 
definida. Estos términos de segundo orden controlan a F cerca del punto estacionario: 


Serie de Taylor F(x) = F(0) + x T (grad F) + -x T Ax + términos de orden superior. (6) 


En un punto estacionario, F = (3F/3x t ,..., 3F/3x„) es un vector de ceros. Las segun¬ 
das derivadas en x r Ax asumen la gráfica hacia arriba, hacia abajo (o en una silla). Si el pun¬ 
to estacionario está en x 0 en vez de en 0, entonces F(x) y todas las derivadas se calculan en 
x 0 . Luego, x cambia a x - x 0 en el miembro derecho. 

La siguiente sección contiene las pruebas para decidir si x T Ax es positiva (el tazón se 
dirige hacia arriba a partir de x = 0). De manera equivalente, las pruebas deciden si la 
matriz A es positiva definida, lo cual constituye el objetivo más importante del capítulo. 
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Conjunto de problemas 6.1 

1. La cuadrática / = x 2 + 4xy + 2y 2 tiene un punto silla en el origen, a pesar de que sus 
coeficientes son positivos. Escriba / como una diferencia de dos cuadrados. 

2. Decida a favor o en contra de la condición de positiva definida de las siguientes ma¬ 
trices, y escriba las / = x r Ax correspondientes: 

, ri 3] [ i -ii .[ 23 ] . r-i 2 

a) [3 5 j' b) [-1 l} c) [3 5 j ^ L 2 -8 • 

El determinante en el inciso b) es cero; ¿a lo largo de cuál recta se encuentra/(x, y) = 0? 

3. Si una matriz simétrica de 2 por 2 satisface las pruebas a > 0, ac > b 2 , resuelva la 
ecuación cuadrática det (A - kl) = 0, y demuestre que los dos valores característicos 
son positivos. 

4. Decida entre un mínimo, un máximo o un punto silla para las siguientes funciones. 

a) F = — 1 + 4(e x — x) - 5x sen y + óy 2 en el punto x = y = 0. 

b) F — (x 2 - 2x)cos y, con punto estacionario en x = 1, y = ir. 


5. a) ¿Para cuáles números b se cumple que la matriz A 


es positiva definida? 


tí) Factorice A = LDLf cuando b está en el intervalo para la propiedad de positiva de¬ 
finida. 

c ) Encuentre un valor mínimo de |(x 2 4- 2bxy + 9y 2 ) - y para b en este intervalo. 

d) ¿Cuál es el mínimo si b = 3? 

6 . Suponga que los coeficientes positivos ay c dominan a b en el sentido de que a + 
c > 2b. Encuentre un ejemplo que tenga ac < b 2 , de modo que la matriz no sea posi¬ 
tiva definida. 

7. a) ¿Cuáles matrices simétricas de 3 por 3 A ( y A 2 corresponden a/ ( y/ 2 ? 

/i = xf + x\ + X 2 — 2X[X2 — 2*1*3 + 2X2*3 

h — *? + 2x| + 1 1*3 — 2*1*2 — 2 *j*3 — 4*2*3- 

tí) Demuestre que / es una matriz cuadrado perfecto simple y no positiva definida. 
¿Dónde ocurre que f x es igual a 0? 

c) Factorice A 2 en LlJ. Escriba f 2 = x T A 2 x como una suma de tres cuadrados. 

8 . SiA = es positiva definida, pruebe A~ l = q r J en cuanto a esta propiedad. 

9. La cuadrática f{x u xf) = 3{*i + 2x 2 ) 2 + 4*| es positiva. Encuentre su matriz A, 
factorícela en LDL 1 ', y relacione los elementos en D y L con 3, 2, 4 en / 

10. Si R = ^ q r j, escriba R 2 y compruebe que es positiva definida a menos que R sea 
singular. 

11. a) Si A = ^ es hermitiana (b complejo), encuentre sus pivotes y su determi¬ 

nante. 

tí) Complete el cuadrado para x^Ax. Ahora x H = [*j * 2 ] puede ser compleja. 

a|*j | 2 + 2Re¿*i * 2 + c |* 2 | 2 = cz|*i + (¿>/íz)* 2| 2 +_ \ x 2 ¡ 2 - 

c) Demuestre que a > 0 y ac > |é | 2 aseguran que A es positiva definida. 

d) Las matrices [ i i ¿ 1 2 '] y [ 4 1 ,• 4 g ^ J, ¿son positivas definidas? 
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12. Decida si F = x 2 y 2 — 2* — 2 y tiene un mínimo en el punto * = y = 1 (después de 
demostrar que las primeras derivadas son cero en ese punto). 

13. ¿En qué condiciones sobre a, b, c se cumple que ax 2 + 2 bxy + cy 2 > x 2 + y 2 para 
toda *, y? 

Los problemas 14 a 18 son sobre pruebas para la propiedad de positiva definida. 

14. ¿Cuáles de A^ A 2 , A 3> A 4 tienen dos valores característicos positivos? Pruebe a > 0 
y ac > b 2 ; no calcule los valores característicos. Encuentre una *, de modo que 
x t A 1 * < 0- 


1 10 
10 100 


1 10 ' 
10 101 ' 


15. ¿Cuál es la cuadrática / = ax 2 + 2bxy + cy 2 para cada una de las siguientes matri¬ 
ces? Complete el cuadrado con la finalidad de escribir/como una suma de uno o dos 
cuadrados d\( ) 2 + d 2 { ) 2 ■ 



y 




16. Demuestre que /(*, y) = * 2 + 4xy + 3y 2 no tiene un mínimo en (0, 0) incluso si 
sus coeficientes son positivos. Escriba /como una diferencia de cuadrados y encuen¬ 
tre un punto (*, y) donde /es negativa. 

17. ( Importante ) Si A tiene columnas independientes, entonces A T A es cuadrada, simétri¬ 
ca e invertible (véase la sección 4.2). Vuelva a escribir x r Á r Ax para demostrar por 
qué es positiva, excepto cuando x = 0. Entonces, A T A es positiva definida. 

18. Pruebe si A T A es positiva definida en cada caso: 





19. Encuentre la matriz A de 3 por 3, sus pivotes, rango, valores característicos, y deter¬ 
minante: 



20. ParaFi(x,y) = |* 4 + * 2 y + y 2 y F 2 (x, y) = * 3 + xy — x, encuentre las ma¬ 
trices segunda derivada A¡ y A 2 : 


' d 2 F/dx 2 d 2 F/dxdy' 
d 2 F/dydx d 2 F/dy 2 


A t es positiva definida, de modo que F¡ es cóncava hacia arriba (= convexa). Encuen¬ 
tre el punto mínimo de F x y el punto silla de F 2 (analice, dónde las primeras deriva¬ 
das son cero). 

21. La gráfica de z ~ x 2 + y 2 es un tazón que se abre hacia arriba. La gráfica de 
z = x 2 _ y 2 es una s iUa. La gráfica de z = —x 2 — y 1 es un tazón que se abre hacia 
abajo. ¿Cuál es una prueba sobre F(x, y) para tener una silla en (0, 0)? 

22. ¿Con qué valores de c se obtiene un tazón, y con cuáles un punto silla para la gráfica 
de z = 4* 2 + 12xy + cy 2 ? Describa esta gráfica en el valor fronterizo de c. 
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6.2 PRUEBAS PARA COMPROBAR SI UNA MATRIZ ES POSITIVA DEFINIDA 

¿Cuáles son las matrices simétricas que poseen la propiedad de que x 7 Ax > 0 para todos los 
vectores x diferentes de cero? Hay cuatro o cinco formas distintas para contestar esta pre¬ 
gunta, y esperamos encontrarlas todas. La sección previa empezó con algunas sugerencias 
sobre los signos de los valores característicos, aunque ello originó las pruebas sobre a, b, c: 

A = ^ ^ es positiva definida cuando a>0 y ac — b 2 > 0. 


A partir de estas condiciones, ambos valores característicos son positivos. Su producto 
X t X 2 es el determinante ac-b 2 > 0, de modo que los valores característicos son ambos po¬ 
sitivos o ambos negativos. Deben ser positivos porque su suma es la traza a + c > 0. 

AI considerar ay ac - b 2 , incluso es posible pronosticar la apariencia de los pivotes. 
Éstos aparecieron cuando x r Ax se descompuso en una suma de cuadrados: 


Suma de cuadrados 


ax 2 + 2 bxy + cy 2 


■ a I x + — y J + 


ac ~ b 2 7 

- y - 


Estos coeficientes a y (ac - b 2 )/a son los pivotes para una matriz de 2 por 2. Para matri¬ 
ces más grandes, los pivotes siguen constituyendo una prueba para comprobar si una ma¬ 
triz es positiva definida: x T Ax es positiva cuando n cuadrados independientes se multiplican 
por pivotes positivos. 

Una observación preliminar más. Las dos partes de este libro se vincularon mediante 
el capítulo sobre determinantes. En consecuencia, se pregunta cuál es el papel que desem¬ 
peñan los determinantes. No basta requerir que el determinante de A sea positivo. Si a = 
c = — 1 y ¿ = 0, entonces det A = 1, pero A = —I = negativa definida. La prueba del de¬ 
terminante se aplica no sólo a A misma, para obtener ac - b 2 > 0, sino también a la sub¬ 
matriz a de 1 por 1 que está en la esquina superior izquierda. 

La generalización natural implica a todas las n de las submatrices superiores izquier¬ 
das de A: 


Ai — [an]. 



ü\2 
°22 _ * 


f «11 

0.12 

<Zl3 

DI 

Q 

II 

422 

423 

L a 3l 

£¡32 

<233 


A continuación se presenta el teorema principal sobre la comprobación de si una ma¬ 
triz es positiva definida, así como una demostración razonablemente detallada: 

6B Cada una de las pruebas siguientes constituye una prueba necesaria y suficien¬ 
te para que la matriz simétrica real A sea positiva definida-, 

(I) x*Ax > 0 para todos los vectores reales x diferentes de cero. v. 

(II) Todos los valores característicos de A satisfacen X¡ > 0. 

(HO Todas las submatrices superiores izquierdas A k tienen determinantes positivos. 
(IV) Todos los pivotes (sin intercambios de renglones) cumplen d k > 0. 


Demostración La condición I define una matriz positiva definida. El primer paso es de¬ 
mostrar que cada valor característico es positivo: 

Si Ax = Xx, entonces x 7 Ax = x 7 Xx = A.||x|| 2 . 

Una matriz positiva definida tiene valores característicos positivos, ya que x T Ax > 0. 
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A continuación se procede en la otra dirección. Si todos los X¡ > 0, es necesario de¬ 
mostrar que x T Ax > 0 para todo vector x (no sólo para los vectores característicos). Debi¬ 
do a que las matrices simétricas tienen un conjunto completo de vectores característicos 
ortonormales, cualquier x es una combinación c x xi + - ■ • + c„x„. Luego, 

Ax = Cj Axi + • • ■ + c n Ax n = CiX¡xi + • • • + c„X„x„. 

Debido a la ortogonalidad, x ]x¡ = 0 , y la normalización xjx¡ = 1, 

x 7 Ax = (c t x 7 + • • • + c n xJ)(c i X 1 x¡ + • • • + c n X n x n ) 

= c\ X t +■■■+ c\x n . (2) 

Si todo k¡ > 0, entonces la ecuación (2) demuestra que x T Ax > 0. Así, la condición II im¬ 
plica la condición I. 

Si la condición I se cumple, entonces también se cumple la condición III: El determi¬ 
nante de A es el producto de los valores característicos. Y si la condición I se cumple, ya 
se sabe que estos valores característicos son positivos. Pero también debe tratarse con toda 
submatriz superior izquierda A k . El truco consiste en considerar a todos los vectores dife¬ 
rentes de cero cuyas últimas n - k componentes sean cero: 

x t Ax = [xj 0] * ** = x 7 A k x k > 0. 

Así, A k es positiva definida. Sus valores característicos (¡no los mismos-A.,!) deben ser po¬ 
sitivos. Su determinante es su producto, por lo que todos los determinantes izquierdos su¬ 
periores son positivos. 

Si la condición III se cumple, entonces también se cumple la condición TV: Según la 
sección 4.4, el k-é simo pivote d k es la razón de det A* a det A*..!. Si todos los determinan¬ 
tes son positivos, también lo son los pivotes. 

Si la condición TV se cumple, entonces también se cumple la condición /: Se cuenta 
con pivotes positivos, y es necesario deducir que x r Ax > 0. Esto fue lo que se hizo en el 
caso de 2 por 2 al completar el cuadrado. Los pivotes eran los números ftiera de los cua¬ 
drados. Para ver cómo ocurre lo anterior para matrices simétricas de cualquier tamaño, se 
regresa a la eliminación de una matriz simétrica: A = LDL 7 . 


Ejemplo 1 


Pivotes positivos 2, | y í: 


0 -1 


-f = LDL J . 


Se busca separar x T Ax en x T LDL T x: 


v , entonces L l x 


Así, x t Ax es una suma de cuadrados con los pivotes 2, | y | como coeficientes: 

x T Ax = (L T x) T D(L 7 x) =2 4- ^(tf) 2 - 

Estos pivotes positivos en D multiplican cuadrados perfectos para hacer positiva a x r Ax. 
Así, la condición IV implica la condición I, y la demostración está compieta. ■ 


x l Ax = (L x)‘ D(L x) =2 ( u 


2 Y 4 , 

3 W ) + 3 (W) ■ 


Es hermoso que la eliminación y la completación al cuadrado sean realmente lo mismo. 
La eliminación retira a x x de todas las ecuaciones posteriores. De manera semejante, el primer 
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cuadrado explica todos los términos en x T Ax que implican a^.La suma de cuadrados tie¬ 
ne a los pivotes fuera. ¡Los multiplicadores t¡j están dentrol En el ejemplo, puede ver los 
números — i y — | dentro de los cuadrados. 

¿ J , 

Todo elemento diagonal a¡¡ debe ser positivo. Como se sabe por los ejemplos, no obs¬ 
tante, es mucho más que suficiente observar sólo los elementos en la diagonal. 

Los pivotes d¿ no deben confundirse con los valores característicos. Para una matriz 
positiva definida típica, se trata de dos conjuntos completamente distintos de números po¬ 
sitivos. En el ejemplo de 3 por 3, quizá la prueba más fácil sea la del determinante: 

Prueba del determinante detA¡ = 2, det A 2 = 3, det A 3 = det A = 4. 

Los pivotes son las razones d¡ = 2, d 2 = §, d 3 = Normalmente, la prueba de los valo¬ 
res característicos es el cálculo más largo. Para esta A se sabe que todos los As son positivos: 
Prueba del valor característico X x — 2 — -J2, X 2 = 2, X-¡ = 2 + -J2. 

Aunque es la más difícil de aplicar a una simple matriz, la prueba de los valores caracte¬ 
rísticos puede ser la de más utilidad para efectos teóricos. Cada prueba es suficiente por 
sí misma. 


Matrices positivas definidas y mínimos cuadrados 

Espero que el lector permita la presentación de una prueba más para comprobar si una ma¬ 
triz es positiva definida. Dicha prueba está muy próxima. Las matrices positivas definidas 
se relacionaron con los pivotes (véase el capítulo 1), los determinantes (véase el capítulo 4) 
y con los valores característicos (véase el capítulo 5). Ahora se les ve en los problemas de 
mínimos cuadrados del capítulo 3, provenientes de las matrices rectangulares del capítulo 2. 

La matriz rectangular será R y el problema de mínimos cuadrados será Rx — b. Tiene 
m ecuaciones con m s n (se incluyen los sistemas cuadrados). La elección por mínimos 
cuadrados x es la solución de R T Rx = R 7 b. Esta matriz A = R t R no sólo es simétrica, 
sino que también es positiva definida, como se demostrará a continuación, en el supuesto 
de que las n columnas de R sean linealmente independientes: 


6C La matriz simétrica A es positiva definida si y sólo si 


(V) Existe una matriz i? con columnas independientes tai que A = R r R 


La clave consiste en reconocer a x T Ax como x r R 7 Rx = ( Rx) r ( Rx). Esta longitud al cua¬ 
drado || Rx |i 2 es positiva (a menos que x = 0), porque las columnas de R son independien¬ 
tes. (Si x es diferente de cero, entonces Rx es diferente de cero.) Así, x 7 R 7 Rx > 0 y R r R 
es positiva definida. 

Queda por encontrar una R para la cual A = R T R. Esto ya se hizo dos veces: 
Eliminación A = LDL 7 = (LV£>)( «/DI, 7 ). Así, tomar R = ~/DL 7 . 

Esta descomposición de Cholesky tiene separados los pivotes equitativamente entre L y l7. 
Valores característicos A = Q AQ 7 = (QVA)(VAQ T ). Así, tomar R = Va Q 1 . (3) 


Una tercera posibilidad es R = QVaQ 7 , la raíz cuadrada positiva definida simétrica de 
A. Hay muchas otras opciones, cuadradas o rectangulares, que pueden verse. Si cualquier 
R se multiplica por una matriz Q con columnas ortonormales , entonces ( QR) J (QR ) — 
R 7 <2 T QR = R 7 1R = A. En consecuencia, QR es otra opción. 

Aplicaciones de las matrices positivas definidas se presentan en mi libro anterior 
Introduction to Applied Mathematics y también en el nuevo Applied Mathematics and 
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Ejemplo 2 


Scientific Computing (consulte la página tiww.wellesleycambridge.com). Se mencio¬ 
na que Ajc = XMx se presenta constantemente en análisis ingenieril. Si A y Ai son positivas 
definidas, este problema generalizado es paralelo al conocido Ax = Xx, y X > 0. M es una 
matriz masa para el método de elementos finitos de la sección 6.4. 

Matrices semidefinidas 

Las pruebas para comprobar si una matriz es positiva definida relajan x r Ax > 0, X > 0, 
d > 0, y det > 0, para dejar que aparezcan ceros. La cuestión principal es ver analogías con 
el caso positiva definida. 

6D Cada una de las pruebas siguientes constituye una prueba necesaria y suficien¬ 
te para que una matriz simétrica real A sea positiva semidefinida: 

(I') x r Ax — 0 para todos los-vectores x (esto define a las matrices positivas semi- 
' definidas). 

(I!.') Todos-Ios. valores característicos de A satisfacen. X¿ a 0.. 

(HT) Ninguna submatriz principal tienen determinantes negativos. 

(IV') Ningunos pivotes son negativos. . ■. 

(V') Existe una matriz R, quizá con columnas dependientes, tal que A = R r R. 

La diagonahzación de A = QAQ T conduce a/Ai = x T Q A Q r x - y 7 Ay . Si el rango de 
A es r, en > ,T Av = Xiyf + ■ ■ • + X r y, hay r Xs diferentes de cero y r cuadrados perfectos. 

Nota La novedad es que la condición m' es válida para todas las submatrices principales, 
no sólo para aquellas que están en ¡a esquina superior izquierda. En caso contrario, no se¬ 
ría posible distinguir entre dos matrices cuyos determinantes superiores izquierdos fuesen 
todos cero: 


es positiva semidefinida, y 


0 0 
0 -1 


es negativa semidefinida. 


Para mantener la simetría, un intercambio de renglones va acompañado de un intercambio 
de columnas. 


-1 es positiva semidefinida, por todas las cinco pruebas: 
2 


(T) x 7 Ax = (xi — x 2 ) 2 + (x t — X3) 2 + (x 2 — X3) 2 > 0 (cero si Xj = x 2 = x 3 ). 

(IT) Los valores característicos son X¡ = 0, X 2 = X 3 = 3 (y cero los valores característicos). 
(Ht') det A = 0 y los determinantes menores son positivos. 


(IV') A = 


-1 -1 
2 -I 
-1 2 



'2 

0 

0 ' 

-* 

0 

3 

2 

0 


0 

0 



(V') A = R t R con columnas dependientes en R: 


0 (1, 1, 1) en el espacio nulo. 

1 
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Observación Las condiciones para que una matriz sea semidefinida también pudieron de¬ 
ducirse de las condiciones originales I a V si se usa el siguiente truco: sumar un pequeño 
múltiplo de la identidad para obtener una matriz positiva definida A+el. Luego, <? tien¬ 
de a cero. Debido a que los determinantes y los valores característicos dependen continua¬ 
mente de e = 0 , son positivos hasta el último momento. En e deben seguir siendo no 
negativos. 

A menudo, mis alumnos me preguntan sobre matrices positiva definida no simétricas. 
Nunca se utiliza este término. Lina definición razonable es que la parte simétrica j(A + A T ) 
debe ser positiva definida. Eso garantiza que las partes reales de los valores característi¬ 
cos son positivas. Aunque esto no es necesario: A — j~ q jj tiene X > 0 pero \(A + A T ) 

| es indefinida. 

Si Ax = Xx, entonces x H Ax = Xx H x y x H A H x = A.x H x. 

Al sumar \x a (A + A H )x = (Re X)x H x >0 de modo que ReX > 0. 

Elipsoides en n dimensiones 

En todo este libro, la geometría ha sido de ayuda para el álgebra de matrices. Una ecuación 
lineal produjo un plano. El sistema Ax = b proporciona una intersección de planos. Los mí¬ 
nimos cuadrados proporcionaron una proyección perpendicular. El determinante es el vo¬ 
lumen de una caja. Luego, para una matriz positiva definida y su x T Ax, finalmente se 
obtiene una figura curva. Se trata de una elipse en dos dimensiones, y de un elipsoide en n 
dimensiones. 

La ecuación que debe considerarse es x r Ax = 1. Si A es la matriz identidad, esto 
se simplifica a xf + x\ + • • • + x 2 = 1. Ésta es la ecuación de la “esfera unitaria” en R" 
Si A = 47, la esfera se vuelve más chica. La ecuación cambia a 4xf + • • • + 4x 2 — 1. 
En vez de pasar por (1, 0, . . . , 0), lo hace por ( i, 0, .... 0). El centro está en el origen, 
ya que si x satisface x T Ax = 1, también lo hace el vector opuesto -x. El paso importante es 
pasar de la matriz identidad a una matriz diagonal : 

'4 

Elipsoide Para A = 1 

i 

9 

Debido a que los elementos son desiguales (¡y positivos!), la esfera cambia a un elipsoide. 

Una solución es x = (j, 0, 0) a lo largo del primer eje. Otra es x = (0, 1, 0). El eje ma¬ 
yor tiene el punto más alejado x = (0, 0, 3). Se parece a una pelota de fútbol americano o 
rugby, aunque no exactamente; éstas están más próximas a x\ +xf + jxf = 1. Los dos 
coeficientes iguales las hacen circulares en el plano x r x 2 , ¡y más fáciles de lanzar! 

A continuación se presenta el paso final, para permitir elementos diferentes de cero le¬ 
jos de la diagonal de A. 

Ejemplo 3 A = [4 5 ] y x T Ax = 5 u 2 + 8 uv + 5u 2 = 1- Esta elipse está centrada en u = v = 0, 

aunque los ejes no son tan claros. Los 4s fuera de la diagonal dejan positiva definida a la 
matriz, aunque hacen rotar la elipse, ya que sus ejes dejan de estar alineados con los ejes 
de coordenadas (véase la figura 6.2). Se demostrará que los ejes de las elipses apuntan ha¬ 
cia los vectores característicos de A. Debido a que A = A T , estos vectores característicos 
y los ejes son ortogonales. El eje mayor de la elipse corresponde al valor característico más 
pequeño de A. 


, la ecuación es x T Ax = 4xf + xf + |x 2 = 1. 




i I i 7 3 e 
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Figura 6.2 La elipse x T Ax = 5u 2 + 8 uv + 5v 2 = 1 y sus ejes principales. 

Para localizar la elipse se calculan Áj = 1 y X 2 = 9. Los vectores característicos uni¬ 
tarios son (1, — X)/ \¡1 y (1,1)/ s¡2 . Estos son ángulos de 45° con los ejes u-v, y están 
alineados con los ejes de la elipse. La forma para ver correctamente a la elipse es volver a 
escribir x^Ax = 1: 

Nuevos cuadrados 5w 2 + ’&uv + v 2 = ( -+ 9 ( — - 1 - — ^ =1 ( 4 ) 

\V2 V2 ) VV2 V2J 

X = 1 y X = 9 están fuera de los cuadrados. Los vectores característicos están dentro. Es¬ 
to es diferente para completar el cuadrado a5(M + |i)) 2 + |u 2 , con los pivotes fuera. 

El primer cuadrado es igual a 1 en (1 / -Jl, — 1 / -Jl) al final del eje mayor. El eje menor 
es un tercio más corto, ya que para cancelar el 9 se requiere (í) 2 . 

Cualquier elipsoide x T Ax = 1 puede simplificarse de la misma manera. El paso clave 
es diagonalizar A — QAQ T . La figura se enderezó al hacer girar los ejes. Algebraicamen¬ 
te, el cambio a y = Q r x produce una suma de cuadrados: 

x t Ax = (x T e)A(Q T x) = y r Ay = X iy 2 + ■■■ + \ n y 2 n = 1 . (5) 

El eje mayor tiene y\ — 1/ -JX[ a lo largo del vector característico con el menor valor ca¬ 
racterístico. 

Los otros ejes están en dirección de los otros vectores característicos. Sus longitudes 
son 1/V^ 2 , • - -, 1 /s/Kñ- Observe que los Xs deben ser positivos -la matriz debe ser posi¬ 
tiva dejinida — o estas raíces cuadradas están en problemas. Una ecuación indefinida 
y\ - 9yf = 1 describe una hipérbola y no una elipse. Una hipérbola es una sección trans¬ 
versal que pasa por una silla, y una elipse es una sección transversal que pasa por un tazón. 

El cambio de x a y = Q T x hace girar los ejes del espacio para coincidir con los ejes 
del elipsoide. En las variables y puede verse que se trata de un elipsoide, ya que la ecua¬ 
ción se vuelve manipulable: 

6E Suponga que A = Q A Q r con k¡ > 0. Al hacer girar y = Q r x se simplifica 
x t Ax = 1: 

V x T Q A Q t x = 1, y T Ay = 1, y X t yf + • • • + X n y 2 = 1. 

Esta es la ecuación de un elipsoide. Sus ejes tienen longitudes 1 /^/X7,..., 1 !-fKi a 
partir del centro. En el espacio x original apuntan a lo largo de los vectores caracterís¬ 
ticos de A. 
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La ley da la inercia 

Para eliminación y valores característicos, las matrices se vuelven más sencillas mediante 
operaciones elementales. La cuestión esencial es saber cuáles propiedades de una matriz 
permanecen sin cambio. Cuando un múltiplo de un renglón se resta de otro renglón, el es¬ 
pacio renglón, el espacio nulo, el rango y el determinante -todos- permanecen igual. Para 
valores característicos, la operación básica fue una transformación de semejanza A -> 
S~ l AS (oA-+ M~~ X AM). Los valores característicos permanecen sin cambio (así como la 
forma de Jordán). Ahora se pregunta lo mismo para matrices simétricas: ¿cuáles son las 
operaciones elementales y sus invariantes para x r Axl 

La operación básica sobre una forma cuadrática es cambiar variables. Un nuevo vec¬ 
tor y está relacionado con x por medio de alguna matriz no singular, x = Cy. La forma cua¬ 
drática se convierte en y T C T ACy. Esto muestra la operación fundamental sobre A: 

Transformación de congruencia A —*■ C T AC para alguna C no singular. (6) 

La simetría de A se preserva, ya que C T AC permanece simétrica. La pregunta verdadera es 
¿qué otras propiedades comparten A y C T AC? La respuesta la proporciona la ley de la iner¬ 
cia de Sylvester. 

-8P C t AC tiene el mismo número de valores característicos positivos,. Valores ca¬ 
racterísticos negativos, y valores característicos cero que A. 

Los signos de los valores característicos (y no los valores característicos mismos) se 
preservan con una transformación de congruencia. En la demostración, se supondrá que A 
es no singular. Así, C T AC también es no singular, y no hay valores característicos de que 
preocuparse. (En caso contrario, es posible trabajar con la no singular A+dyA-e/j 
al final hacer € -» 0.) 

Demostración Tomaremos prestado un truco de topología. Suponga que C está relacio¬ 
nada con una matriz ortogonal Q, por medio de una cadena continua de matrices no sin¬ 
gulares C(t). En t - 0 y t = 1, C(0) = CyC(l) = g. Así, los valores característicos de 
C(f) T AC(í) cambian gradualmente, cuando t va de 0 a 1, de los valores característicos 
de C t AC a los valores característicos de Q r AQ. Debido a que C(f) nunca es singular, nin¬ 
guno de estos valores característicos puede tocar a cero (¡por no decir cruzarlo!) En con¬ 
secuencia, el número de valores característicos a la derecha de cero, y el número a la 
izquierda, es el mismo para C r AC que para Q T AQ. Y A tiene exactamente los mismos va¬ 
lores característicos que la matriz semejante Q~ X AQ = Q r AQ. 

Una buena elección de Q consiste en aplicar el proceso de Gram-Schmidt a las colum¬ 
nas de C. Así, C = QR, y la cadena de matrices es C(f) — tQ + (1 - f)QR. La familia C(t) 
va lentamente a través del proceso de Gram-Schmidt, de QR a Q. Es invertible porque Q 
es invertible y la diagonal del factor triangular ti + (1 - f)R es positiva. Así se termina la 
demostración. a 

Ejemplo 4 Suponga que A = I. Entonces C T AC = C T C es positiva definida. Tanto / como C T C tienen 
n valores característicos positivos, lo cual confirma la ley de la inercia. 

Ejemplo 5 Si A = j , entonces C T AC tiene un determinante negativo: 

det C 1 AC — (detC T )(det A)(detC) = —(detC) 2 < 0. 

Entonces C T AC debe tener un valor característico positivo y un valor característico nega¬ 
tivo, como A. 
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Ejemplo 6 Esta es la aplicación importante: 

IG Para cualquier matriz simétrica A, los signos de ios pivotes coinciden con los 
signos de los valores característicos, hit matriz valor característico A y la matriz pi¬ 
vote D tienen el mismo número de elementos positivos, elementos negativos, y ele¬ 
mentos cero. . 

Se supondrá que A permite la factorización simétrica A = LDl7 (sin intercambios de ren¬ 
glones). Por la ley de la inercia, A tiene el mismo número de valores característicos positi¬ 
vos que D. Sin embargo, los valores característicos de D son justo sus elementos diagonales 
(los pivotes). Así, el número de pivotes positivos coincide con el número de valores carac¬ 
terísticos positivos de A. 

Lo anterior es hermoso y práctico. Es hermoso porque conlleva (para matrices simétri¬ 
cas) dos partes de este libro que previamente estaban separadas: los pivotes y los valores 
característicos. También es práctico, ya 
racterísticos: 

A tiene pivotes positivos 
A-21 tiene un pivote negativo 

Gracias a nuestra prueba, los valores característicos de A son positivos. Pero se sabe que A mín 
es menor que 2, porque al restar 2 hizo que éste cayera bajo cero. En el siguiente paso se 
aborda A - /, para ver A^ < 1. (Esto se debe a que A-I tiene un pivote negativo). El inter¬ 
valo que contiene a A se divide a la mitad en cada paso al comprobar el signo de los pivotes. 

Este era casi el primer método práctico para calcular valores característicos. Era domi¬ 
nante alrededor de 1960, después de una mejora importante: hacer tridiagonal a A primero. 
Luego, los pivotes se calculaban en 2 n pasos, en vez de en | n 3 . La eliminación se vuelve rá¬ 
pida, y la búsqueda de valores característicos (al dividir en dos los intervalos) se vuelve sim¬ 
ple. El favorito actual es el método QR que se presenta en el capítulo 7. 

El problema generalizado de valores característicos 

En sus problemas de valores característicos, la física, la ingeniería, y la estadística suelen 
ser suficientemente bondadosas para producir matrices simétricas. Sin embargo, algunas 
veces Ax = Xx se sustituye por Ax = XMx. Hay dos matrices, en vez de una. 

Un ejemplo es el movimiento de dos masas distintas en una línea de resortes: 

d 2 v 

mi —— 

dt 2 

d 2 w 
m 2 ——— 
dt 2 

Cuando las masas son iguales, m x = m z = 1, este era el sistema anterior u" + Au — 0. Aho¬ 
ra es Mu" + Au = 0, que es una matriz “masa ” M. El problema de valores característicos 
surge cuando se buscan soluciones exponenciales e ,w, x: 

Mu" + Au = 0 se convierte en M(ia>) 2 e ,a "x + Ae ia, x — 0. (8) 

Al cancelar e ,wt , y al escribir A por co 2 , este es un problema de valores característicos: 

Problema generalizado Ax — X Mx 7 í x = A m ' ^ x. (9) 

— 1 2 U m 2 



que los pivotes pueden localizar a los valores ca- 


'3 

3 

0‘ 

r i 

3 

0' 

3 

10 

7 

A - 2/ = 3 

8 

7 

0 

7 

8 

0 

7 

6 
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Existe una solución cuando A - XM es singular. La elección especial M - I devuélvela ex¬ 
presión de costumbre det (A - XI) = 0. det (A - XM) se trabajara con m, - 1 y m 2 - 2. 

i -i 3 ± 75 

det 2 - A- 1 = 2X 2 - 6X + 3 = 0 proporciona X - - • 

— 1 2 2X 

Para el vector característico x, = (75 - 1, 1), las dos masas oscilan juntas, aunque la 
primera sólo se mueve 75 - 1 » 0.73 En el modo más rápido, las componentes de 
= (j + 75 - 1) tienen signos opuestos y las masas se mueven en direcciones opuestas. 

Esta vez la masa más pequeña avanza mucho más. 

La teoría subyacente es más fácil de explicar si M se separa en R R. (Se supone que M 
es positiva definida). Luego, la sustitución y = Rx cambia 

Ax = XMx = XR r Rx hacia AR~'y = XR T y. 

Al escribir C por R~ l , y multiplicar por (R T r> = C T . lo anterior se convierte en un pro¬ 
blema de valores característicos estándar para la matriz simétrica simple C AC. 

Problema equivalente C T ACy = Xy. (10) 

Los valores característicos kj son los mismos que para la Ax = AMx original, y los vecto- 
7i™c,e„-sücos estín recado, por,, - Rxj. Las propias d. <?AC Wd-n d- 
rectamente a las propiedades de Ax = XMx, cuando A = A y M es positiva defimda. 

1 Los valores característicos para Ax = XMx son reales, porque C T AC es simétrica. 

2. Por la ley de la inercia, los ks tienen el mismo signo que los valores característicos 

3. %'aC. tiene vectores característicos ortogonales » Así, los vectores característicos de 
Ax = XMx tienen 

“M-ortogonalidad” xjMxj = xj R r Rx¡ — yjyj — 0- (H) 

Ay M se diagonalizan simultáneamente. Si S tiene los x¡ en sus columnas entonces 
<? T A g - A V S T MS = /. Esta es una transformación de congruencia, con S en la izquier¬ 
da y no una transformación de semejanza con S~\ Es fácil resumir la cuestión impor¬ 
tante: En tanto M es positiva definida, el problema generalizado de valores característicos 
Ax = AMx se comporta exactamente como Ax = Xx. 


Conjunto de problemas 6.2 

1. ¿Para qué intervalo de números ayb ocurre que las matrices A y B son positiva defi¬ 
nida? 

’í 2 2] [12 4' 

A = 2 a 2 B — 2 b 8 . 

2 2 a] L 4 8 1 ■ 


2. Decida si las siguientes matrices son positiva definida o no: 



2 

-1 

- 1 ! 

'0 

1 

2 ] 

B = -1 

2 

i 

, C = 1 

0 

1 

.-1 

1 

2 _ 

[2 

I 

0 
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principal: 

'1 b -b 

A = b 1 b con \b\ < 1 puede tener det A < 0. 

-b b 1 

4. Demuestre a partir de los valores característicos que si A es positiva definida, enton¬ 
ces también lo son A 2 y A -1 . 

5 SiAyB son positiva definida, entonces A + B es positiva definida. Los pivotes y los 
valores característicos no son convenientes para A + B. Es mucho mejor intentar 
x t (A + B)x > 0. 

6. A partir de los pivotes, los valores característicos y los vectores característicos de 
A = jj, escriba A como R T R en tres formas: 

(L7d)(7dL t ),( 7TA) (7A0 t ), y (e7AG T )(Q7A2 T ). 


7. 


Si A = QAQ r , es positiva definida simétrica, entonces R = Q-/AQ r es su raíz 
cuadrada positiva definida simétrica. ¿Por qué los valores característicos de R son po¬ 
sitivos? Calcule R, y compruebe que R 2 = A para 




8. Si A, es positiva definida simétrica y C es no singular, demuestre que B = C T AC tam¬ 
bién es positiva definida simétrica. 


9. Si A = R r R, demuestre la desigualdad de Schwarz generalizada |x T Ay| 2 < (x T Ax) 
(y T Ay). 

10. La elipse u 2 + 4v 2 = 1 corresponde a A = ¿ ° j. Escriba los valores característicos 

y los vectores característicos, y trace la elipse. 


11. Reduzca la ecuación 3 u 2 — 2-fi2uv + 2v 2 = 1. a una suma de cuadrados encontran¬ 
do los valores característicos de la A correspondiente, y trace la elipse. 


12. En tres dimensiones, Xiyf + X 2 y\ + X 3 y 2 = 1 representa un elipsoide cuando 
todos los X¡ > 0. Describa todas las distintas clases de superficies que aparecen en el ca¬ 
so positiva semidefinida cuando uno o más de los valores característicos es (son) cero. 


13. Escriba las cinco condiciones para que una matriz de 3 por 3 sea negativa defimda 
(—A es positiva defimda) con atención especial a la condición III: ¿Cómo está relacio¬ 
nado det (—A) con det A? 


14. Decida si las siguientes matrices son positivas definidas, negativas definidas, semíde- 
finidas, o indefinidas: 



2 0 0l 



— 5 y 2 — 9 z 2 — 4 xy — 6xz — 8 yz — 1? 


15. Suponga que A es positiva definida simétrica y que Q es una matriz ortogonal. ¿Falso 
o verdadero? 

a) Q t AQ es una matriz diagonal. 
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b) Q t AQ es positiva definida simétrica. 

c ) Q r AQ tiene los mismos valores característicos que A. 

d) e~ A es positiva definida simétrica. 

16. Si A es positiva definida y se incrementa a n , a partir de cofactores demuestre que el 
determinante se ha incrementado. Demuestre con un ejemplo que lo anterior puede ta¬ 
llar si A es indefinida. 

17. A partir de A = R r R, demuestre para matrices positivas definidas que det A < 
ano .22 ■■■a nn . (La longitud al cuadrado de la columna; de R es %. Use determinan¬ 
te = volumen.) 

18. (Prueba de M de estabilidad de Lyapunov) Suponga que AM + M H A = -/ con A po¬ 
sitiva definida. Si Mx = Xx, demuestre que Re X < 0. ( Sugerencia : Multiplique la pri¬ 
mera ecuación por x* 1 y x.) 

19. ¿Cuáles matrices simétricas A de 3 por 3 producen las siguientes funciones / — x Ax. 
¿Por qué la primera matriz es positiva definida pero la segunda no? 

a) f = 2(x? + xf + xf - x x x 2 - * 2 * 3 ). 

b) / = 2 (x?+xf+x^-xix 2 -X 1 X 3 -x 2 x 3 ). 

20. Calcule los tres determinantes superiores izquierdos para establecer la condición de po¬ 
sitiva definida. Compruebe que sus razones proporcionan los pivotes segundo y tercero. 

'2 2 0‘ 

A = 2 5 3 . 

0 3 8_ 

21. Una matriz positiva definida no puede tener un cero (o incluso peor: un número nega¬ 
tivo) en su diagonal. Demuestre que esta matriz no cumple x Ax>0: 


'4 1 1 

[xi x 2 x 3 ] 102 


1 es positiva cuando (xi, x 2 , x 3 ) — ( 


22. Un elemento diagonal % de una matriz simétrica no puede ser menor que todos los As. 


Si lo fuese, entonces A - % / tendría . 


valores característicos y posiblemente se- 


ría positiva definida. Sin embargo, A - %/ tiene un-en la diagonal principal. 

23. Proporcione una razón rápida de por qué las siguientes afirmaciones son verdaderas: 

a) Toda matriz positiva definida es invertible. 

b ) La única matriz proyección positiva definida es P = 1. 

c) Una matr iz diagonal con elementos diagonales positivos es positiva definida. 

d) ¡Una matriz simétrica con un determinante positivo podría no ser positiva definida. 

24. ¿Para cuáles s y t se cumple que Ay B tienen a todos los A. > 0 (y por tanto son posi¬ 
tivas definidas)? 

s -4 - 4 I t 3 0 

,4 = — 4 s — 4 y E = 3 í 4 . 


25. Tal vez usted ya haya visto la ecuación de una elipse como (*) + (|) /¿Cuáles 

son a y b cuando la ecuación se escribe como X x x 2 + X 2 y 2 = 1? La elipse 9x 2 + 
\(¡y- _ j t j ene sein iejes cuyas longitudes son a =- y b = -• 


6.2 Pruebas para comprobar si una matriz es positiva definida 


26. Trace la elipse inclinada x 2 + xy + y 2 = 1 y encuentre las semilongitudes de sus 
ejes, a partir de los valores característicos de la A correspondiente. 

27. Con pivotes positivos en D, la factorización A = LDL r se convierte en La/o/oU. 
(Las raíces cuadradas de los pivotes proporcionan D = JT5-JT). Así, C = L-JTj 
conduce a la factorización de Cholesky A = CC T , que es “simetrizada Llf’: 


A partir de C 


encuentre A. A partir de A 


encuentre C. 


28. En la factorización de Cholesky A = CC T , con C = L\ÍD , las raíces cuadradas de los 
pivotes están en la diagonal de C. Encuentre C (triangular inferior) para 


x 7 LDL T x: 

1 b/a 
)/a 0 1 


"9 

0 

0' 

"1 

1 

r 

A = 0 

1 

2 y 

A = 1 

2 

2 

0 

2 

8_ 

1 

2 

7 


29. La factorización simétrica A 

r x \a b I M r 


LDL t significa que x 7 Ax = x 7 ¡ 

1 r 1 0] \a 0 

b/a 1 0 ( ac—b 2 )/a 


El miembro izquierdo es ax 2 + 2bxy + cy 2 . El miembro derecho es a(x + ¿y) + 
_./• 

¡El segundo pivote completa el cuadrado! Pruebe con a = 2, b = 4, c = 10. 

c,. , . _ feos# -sen $ 1 \l 01 f cos0 sen# 1 

30. Sin multiplicar A — |^ eng cos9 J [ 0 5 J |_-sene cossj’ encuentre: 

a) El determinante de A. 

b) Los valores característicos de A. 

c) Los vectores característicos de A. 

d) Una razón de por qué A es positiva definida simétrica. 

31. Para las matrices semidefinidas 


2 

-1 

-r 

"1 

1 

r 

-1 

2 

— 1 (rango 2) y B = 

1 

1 

i 

-1 

-1 

2_ 

1 

1 

i 


A = —1 2—1 (rango 2) y B — 1 1 1 (rango 1), 

-i -1 2J [1 1 1_ 

Escriba x T Ax como una suma dos cuadrados y x T Bx como un cuadrado. 
Aplique tres pruebas cualesquiera para probar cada una de las siguientes matrices 


"i 

i 

r 

"2 

1 

2' 

i 

i 

i 

y B = 1 

1 

1 

i 

i 

0 

2 

1 

2 


y decidir si son positivas definidas, positivas semidefinidas, o indefinidas. 

Para C = [o -i] y A = [j | j, confirme que C T AC tiene valores característi¬ 
cos de los mismos signos que A. Construya una cadena de matrices no singulares C(t ) 
que relacione a C con una Q ortogonal. ¿Por qué es imposible construir una cadena no 
singular que relacione a C con la matriz identidad? 

Si todos los pivotes de una matriz son mayores que 1, ¿es cierto que todos los valores 
característicos son mayores que 1? Pruebe lo anterior con las matrices tridiagonales 
- 1 , 2 , - 1 . 
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35. Use los pivotes de A - 5 / para decidir si A tiene un valor característico menor que 5 : 

[2.5 3 0 ' 

A — —I = 3 9.5 7 . 

2 L° 7 7 - 5 . 

36. Una demostración algebraica de la ley de la inercia empieza con los vectores caracte¬ 
rísticos ortonormales x„ . . ., x p de A correspondientes a los valores característicos 
X¡ > 0, y los vectores característicos ortonormales y u ... ,y g deC T .AC correspondien¬ 
tes a los valores característicos jx¡ < 0 . 

a) Para demostrar que los p + q vectores x u ..., x p , Cy 1 ,..., Cy q son independien¬ 
tes, suponga que alguna combinación proporciona cero: 

a 1 x 1 + • • • +a p x p = b x Cy x + ■ ■ ■ +b q Cy q (= z, digamos). 

Demuestre que z T Az = X\a\ -i-+ X p a 2 > 0 y z r Az = p-ib\ 3-b P q b q < 0. 

b) Deduzca que las as y las bs son cero (demostrando independencia lineal). Con ba¬ 
se en lo anterior, deduzca que p + q £ n. 

c) Con el mismo razonamiento para los n - p As negativos y los n — q ps positivos se 
obtiene n-p + n-q^n. (Nuevamente se supone que no hay valores caracterís¬ 
ticos diferentes de cero, que se manejan por separado). Demuestre que p + q = n, 
de modo que el número p de As positivos es igual al número n-q de /xs positivos; 
lo cual es la ley de la inercia. 

37. Si C es no singular, demuestre que A y C r AC tienen el mismo rango. Así, tienen el 
mismo número de valores característicos cero. 

38. Por experimentación, encuentre el número de valores característicos positivos, nega¬ 
tivos, y cero de 

, _ [/ B 
A 0 

cuando el bloque B (de orden j ri) es no singular. 

39. ¿A y C t AC siempre satisfacen la ley de la inercia cuando C no es cuadrada? 

40. En la ecuación (9) con m¡ = 1 y m 2 = 2, compruebe que los modos normales son M 
ortogonales: xjMx 2 = 0 . 

41. Encuentre los valores característicos y los vectores característicos de Ax = A Mx: 

6 -3] A \4 f 

-3 6J X 18 L 1 4 J 

42. Si las matrices simétricas Ay M son indefinidas, Ax = X Mx podría no tener valores 
característicos reales. Construya un ejemplo de 2 por 2. 

43. Un grupo de matrices singulares incluye AB y A~ l si incluye a A y B. “Los produc¬ 
tos e inversas permanecen en el grupo”. ¿Cuáles de los siguientes conjuntos son gru¬ 
pos? Matrices positivas definidas simétricas A, matrices ortogonales Q, todas las 
exponenciales e ,A de una matriz fija A, las matrices P con valores característicos po¬ 
sitivos, matrices D con determinante 1. Invente un grupo que sólo contenga matrices 
positivas definidas. 
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6.3 DESCOMPOSICIÓN DEL VALOR SINGULAR 

Para el final del curso básico se ha dejado una gran factorización matricial. IJ £V T se 
vincula con LU de la eliminación y con QR de la ortogonalización (Gauss y proceso de 
Gram-Schmidt). No se le ha asignado ninguna denominación o nombre: A = U £ V T se co¬ 
noce como “DVS” o descomposición del valor singular. Así como “SVD” por sus siglas 
en inglés. Se quiere describirlo, demostrarlo, y analizar sus aplicaciones, que son muchas 
y cada vez más numerosas. 

La DVS está estrechamente relacionada con la factorización valores característicos- 
vectores característicos QAQ r de una matriz positiva definida. Los valores característicos 
están en la diagonal de la matriz A. La matriz vector característico Q es ortogonal (Q r Q = 
1 ) porque es posible escoger que los vectores característicos de una matriz simétrica sean 
ortonormales. Esto no es cierto para la mayor parte de las matrices, y para las matrices rec¬ 
tangulares es ridículo (porque los valores característicos están indefinidos). Sin embargo, 
ahora se permite que Q a la izquierda y Q 1 a la derecha sean dos matrices ortogonales cua¬ 
lesquiera U y V T , no necesariamente traspuestas entre sí. Así, toda matriz puede separarse 
en A = UZ¡V T . 

¡La matriz diagonal (pero rectangular) £ tiene valores característicos de A r A, no de 
A! Estos elementos positivos (que también se denominan sigma) son £,,...,£,.. Son los 
valores singulares de A, y ocupan los r primeros sitios sobre la diagonal principal de E, 
cuando el rango de A es r. El resto de E es cero. 

Con matrices rectangulares, casi siempre la clave es considerar A T A y AA T . 

- * 

Descomposición del valor singular: Cualquier matriz Adera por n puede factori- 
zarse como ■ i 

A = U £V T = (ortogonal)(diagonal)(ortogonal). 

Las columnas de U {que es de m por m) son vectores característicos de AA T , y las co¬ 
lumnas de V (que es de n por ri) son los vectores característicos de A T A. Los r valo¬ 
res singulares en la diagonal de S (m por ri) son las raíces cuadradas de los valores 
característicos diferentes de cero tanto' de AA T como de A T A. 

Observación 1 Para matrices positivas definidas, E es A y U £V X es idéntica a QAQ r . 
Para otras matrices simétricas, cualesquiera valores característicos negativos en A se vuel¬ 
ven positivos en S. Para matrices complejas, E permanece real pero U y L se convierten 
en unitarias (la versión compleja de las matrices ortogonales). Se toman conjugados com¬ 
plejos en U H U =/ y V H V =/ y A = U EV H . 

Observación 2 U y V constituyen bases ortonormales de todos los cuatro subespacios 
fundamentales: 

Las primeras r columnas de U: espacio columna de A 

Las últimas m — r columnas de U: espacio nulo izquierdo de A 

Las primeras r columnas de V: espacio renglón de A 

Las últimas n — r columnas de V: espacio nulo de A 

Observación 3 La DVS escoge estas bases de una manera extremadamente especial. Son 
más que simplemente ortonormales. Cuando A multiplica a una columna v ¡ de V, produce 
E ¡ veces una columna de U. Este hecho proviene directamente de AV — U E, considerada 
una columna a la vez. 

Observación 4 Los vectores característicos de AA T y A T A deben ir en las columnas de U 
y V: 
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AA 7 = (UTV 7 )(VT t U t ) = C/SS T t/ T similar, y A 7 A = V£ T £V T . (1) 

U debe ser la matriz vector característico para AA 7 . La matriz valor característico que es¬ 
tá en medio es £ T 7 , que es de m por m con o},. .,, cr 2 en la diagonal. 

Con base en A 7 A = V £ T £ V T , la matriz V debe ser la matriz vector característico 
para A T A. La matriz diagonal £ T £ tiene los mismos ex, 2 ,..., o r 2 , pero es de n por n. 

Observación 5 Esta es la razón por la que Av¡ = OjUj. Se empieza con Á 7 Av¡ = ojAVj : 

Multiplicar por A AA 7 Avj = ojAvj (2) 

¡Lo anterior indica que Avj es un vector característico de AA T ! Simplemente se movieron 
los paréntesis a (. AA 7 )(Avj ). La longitud de este vector característico Avj es £,-, ya que 

v 7 A T Avj = crjvjvj proporciona ||Aiij|| 2 = cr?. 

De modo que el vector característico unitario es Avj/a¡ — u¡. En otras palabras, AV = 
UT. 


Ejemplo 1 


Ejemplo 2 


Esta A sólo tiene una columna: rango r = 1. Entonces, £ sólo tiene £ t = 3: 


DVS 



A 7 A es de 1 por 1, mientras AA 7 es de 3 por 3. Ambas tienen valor característico 9 (cuya 
raíz cuadrada es 3 en £). Los dos valores característicos cero de AA T dejan algo de liber¬ 
tad para los vectores característicos en las columnas 2 y 3 de U. Esta matriz debe mante¬ 
nerse ortogonal. 

r 2 —ii 

Ahora el rango de A es 2, y A A T = _j 2 con X = 3 y 1: 



UTV 7 = 


1 

V2 



V3 0 0' 
0 1 0 


1 -2 ll/Vó 

-1 0 1 /V2. 

1 1 lJ/V3 


Observe a V3 y VI- Las columnas de U son vectores singulares izquierdos (vectores ca¬ 
racterísticos unitarios de AA 7 ). Las columnas de V son vectores singulares derechos (vec¬ 
tores característicos unitarios de A 7 A). 


Aplicaciones de la DVS 

Se presentan algunas aplicaciones importantes, luego de recalcar una cuestión. La DVS es 
terrorífica para cálculos numéricamente estables, ya que U y V son matrices ortogonales. 
Nunca cambian la longitud de un vector. Debido a que \\Ux \\ 2 = x 7 U T Ux — ||x|| 2 , ia 
multiplicación por U no puede destruir el escalamiento. 

Por supuesto, £ puede multiplicar por un gran £ o bien (lo que es más común) divi¬ 
dir entre un £ pequeño, y saturar la computadora. Sin embargo, £ es la mejor posible. 
Revela exactamente qué es grande y qué es pequeño. La razón £ máx /£„,-„ es el número 
de condición de una matriz invertible de n por n. La disponibilidad de esta información 
es otra razón que explica la conocida popularidad de la DVS. En la segunda aplicación se 
volverá a esto. 

1, Procesamiento de imágenes Suponga que un satélite toma una fotografía, y quiere 
enviarla a la Tierra. La fotografía puede contener 1000 por 1000 “pixeles”: un millón de 
cuadros pequeños, cada uno con un color definido. Es posible codificar los colores y trans- 


I 
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mitir 1 DOG -OGO de núinferos. Es. rnejor;ehcpnti;ar la dentro de la ma¬ 

triz de 1000 por 100Ó,'y ehvíár'sólo éso. 

Suponga que se conoce la DVS. La clave está en los valores singulares (en £). Típi¬ 
camente, algunos crs son significantes y otros son extremadamente pequeños. Si se preser¬ 
van 20 y se desechan 980, entonces sólo se envían las 20 columnas correspondientes de V 
y V. Las otras 980 columnas se multiplican por UTA / 7 por los <xs pequeños que se han ig¬ 
norado. La multiplicación de matrices puede hacerse como columnas por renglones : 

A = UTV 7 = u.\ 0 \ v 7 + ii 2&2 vj + • • ■ + u r o r v 7 . (3) 

Cualquier matriz es la suma de r matrices de rango 1. Si sólo se preservan 20 términos, se 
envían 20 veces 2000 números, en vez de un millón (compresión de 25 a 1). 

Las fotografías son verdaderamente sorprendentes, a medida que se incluyen más y 
más valores. Al principio no se ve nada y repentinamente se reconoce todo. El costo está 
en el cálculo de la DVS; ésta se ha vuelto mucho más eficaz, aunque es costosa para una 
matriz grande. 

2. El rango efectivo El rango de una matriz es el número de renglones independien¬ 
tes, y el número de columnas independientes. ¡Esto puede ser difícil de decidir en cálcu¬ 
los! En aritmética exacta, el conteo de los pivotes es correcto. La aritmética real puede ser 
engañosa, aunque eliminar los pivotes pequeños no es la respuesta. Considere lo siguien¬ 
te: 

e es pequeño e 2 e el e 1 

1 2J y [0 Oj 7 L e 1 +e . ' 

El rango de la primera es 1, aunque el error por redondeo probablemente produzca un se¬ 
gundo pivote. Ambos pivotes son pequeños, así que ¿cuántos se ignoran? La segunda tie¬ 
ne un pivote pequeño, pero no es posible pretender que este renglón es insignificante. La 
tercera tiene dos pivotes y su rango es 2, aunque su “rango efectivo” debe ser 1. 

A continuación se procede a una medición más estable del rango. El primer paso es 
utilizar A 7 A o AA 7 , que son simétricas pero tienen el mismo rango que A. Sus valores ca¬ 
racterísticos -los valores singulares al cuadrado— no son engañosos. Con base en la preci¬ 
sión de los datos, se decide en una tolerancia como 10~ 6 y se cuentan los valores singulares 
arriba de ésta; este es el rango efectivo. Los ejemplos anteriores tienen rango efectivo 1 
(cuando e es muy pequeño). 

3. Descomposición polar Todo número complejo z es un número positivo r multipli¬ 
cado por e‘ e en la circunferencia unitaria: z = re' 6 . Esto expresa a z en “coordenadas pola¬ 
res”. Si se considera que z es una matriz de 1 por 1, r corresponde a una matriz positiva 
dejinida y e lB corresponde a una matriz ortogonal. Más exactamente, debido a que e‘ e es 
complejo y satisface e~ í 0 e‘ e = 1, forma una matriz unitaria de 1 por 1: U H U = I. Se toma 
el conjugado complejo, así como la traspuesta, de U H . 

La DVS extiende esta “faetorización polar” a matrices de cualquier tamaño: 

Toda matriz cuadrada real puede facíorizarse en A = QS, donde Q es ortogonal y S 
es semidefinida positiva simétrica. Si A es invertible, entonces S es positiva definida. 

Para demostrar lo anterior simplemente se inserta V 7 V = I en medio de la D VS: 

A = UTV 7 = (UV t )(VTV 7 ). (A) 
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El factor S = VS V T es simétrica y semidefmida (porque £ lo es). El factor Q UV es 

una^nairiz ortogonal (porque - VI/W - ,). E„ .1 c«o co^ S ,» co™~ 

te en hermitiana en vez de simétrica y 2 se vuelve urntana en vez de ortogonal. En 

so invertible, £ es definida, así como S. 


Ejemplo 3 Descomposición polar: 

A = QS 




Ejemplo 4 Descomposición polar inversa: 





Los ejercicios muestran cómo, en orden inverso, S cambia pero Q permanece igual. Tanto 
S como S' son positivas definidas simétricas porque A es invertib e. 

Aplicación de A = QS: Una utilización fundamental de la descomposición polar se en¬ 
cuentra en mecánica del continuo (y recientemente en robótica). En cualquier deformaci 
es importante separar el alargamiento de la rotación, que es exactamente lo que logra QS. 
La matriz ortogonal Q es una rotación, y quizá una reflexión. El material no expenmen 
deformación. La matriz simétrica S tiene valores característicos £„ . . • , U, que son os 
factores de alargamiento (o de compresión). La diagonalizacion que despliegan estos valo¬ 
res característicos constituye la elección natural de los ejes, denominados ejes principales^ 
así como con las elipses en la sección 6.2. Es 5 la que requiere trabajar con el material, y 

A- es positiva definida simétrica cuando A es invertible. 5 

es la raíz cuadrada positiva definida simétrica de A T A, y Q es AS .De hecho 
rectangular, en tanto A T A sea positiva definida. (Esta es la condición que se ha cumplido 
que A tenga columnas independientes.) En el orden inverso A = S Q, la matriz 5 es la raíz 
c uadrada positiva definida simétrica de AA T . 

4. Mínimos cuadrados Para un sistema rectangular Ax = b, la solución por mínimos 
cuadrados proviene de la ecuación normal A T Ax = A T ¿ . Si Atiene columnas dependien¬ 
tes, entonces A T A no es invertible yx no está determinado. Cualquier vector en el espa¬ 
cio nulo puede sumarse a x . Ahora es posible completar el capítulo 3, eligiendo un mejor 

{más corto ) x para toda Ax = b. . , 

Ax = b tiene dos posibles dificultades: renglones dependientes o columnas dependien¬ 
tes. Con renglones dependientes, Ax = b puede no tener solución. Esto ocurre cuando ¿es¬ 
tá fuera del espacio columna de A. En vez de resolver Ax - b, se resuelve A Ax A . 
Pero si A tiene columnas dependientes, este x no es único. Es necesario escoger una solu¬ 
ción particular de A T Ax = A T b, y se elige la más corta. 

La solución óptima de Ax = bes la s olución de menor longitud de A T Ax = A : b . 

Esa solución de longitud mínima se denomina x + . Es nuestra opción P ref ®^ da c0 “ 10 
la mejor solución de Ax = b (que no tema solución), y también de A Ax - A b (que te¬ 
nía demasiadas). Empezamos con un ejemplo diagonal. 
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Ejemplo 5 A es diagonal, con renglones dependientes y columnas dependientes: 

IV, 0 0 0] [!'l \b{ I 


Todas las columnas terminan con cero. En el espacio columna, el vector más próximo a 
b = (jbi, b 2 , b 3 ) es p = (b u b 2 , 0). Lo mejor que puede hacerse con Ax = b es resolver las 
dos primeras ecuaciones, ya que la tercera ecuación es 0 = b 3 . Este error no puede redu¬ 
cirse, pero los errores en las dos primeras ecuaciones es cero. Así, 

xi = bi/cr , y x 2 = b 2 /o 2 . 

Ahora se enfrenta la segunda dificultad. Con la finalidad de hacer a x lo más peque¬ 
ño posible, se escoge que los totalmente arbitrarios x 3 y x 4 sean cero. La solución de lon¬ 
gitud mínima es x + : 


A + es seudoinversa 
x + — A + b es más corta 


Con esta ecuación se encuentra x + , y también se despliega la matriz que produce x + 
a partir de b. Esta matriz es la seudoinversa A + de la A diagonal. Con base en este ejem¬ 
plo, £ + y x + se conocen para cualquier matriz diagonal £: 

fo-j 1 f 1/cTi 1 \b\la x 1 


bi/ai 


bi/cti 


0 


0 



La matriz £ es de m por n, con r elementos diferentes de cero en £,-. Su seudoinversa £ + 
es n por m con elementos r diferentes de cero en l/£,. Todos los espacios en blanco son 
ceros. Observe que (£ + ) + es de nuevo £. Esto es como (A -1 ) -1 = A, pero aquí A no es 
invertible. 

A continuación se encuentra x + en el caso general. Se afirma que la solución más 
corta x + .siempre está en el espacio renglón de A. Recuerde que cualquier vector x pue¬ 
de separarse en una componente espacio renglón x r y una componente espacio nulo 
x = x r + x„. A continuación se presentan tres cuestiones importantes sobre esa separa¬ 
ción: 

1. La componente espacio renglón también resuelve Á l Ax r — A T b , porque Ax„ = 0. 

2. Las componentes son ortogonales, y cumplen el teorema de Pitágoras: 

||x|| 2 = ||x r || 2 + ||x„|| 2 , de modo que x es más corto cuando x„ = 0. 

3. Todas las soluciones de A T Ax = A r h tienen el mismo x n Ese vector es x + . 

El teorema fundamental del álgebra lineal se mostró en la figura 3.4. Todo p en el espacio 
columna proviene de uno y sólo un vector x r en el espacio renglón. Todo lo que se está ha¬ 
ciendo es escoger ese vector x + = x n como la mejor solución de Ax = b. 

La seudoinversa en la figura 6.3 empieza con b y regresa a x + . Invierte a A donde A 
es invertible : entre el espacio renglón y el espacio columna. La seudoinversa elimina al es¬ 
pacio nulo izquierdo al enviarlo a cero, y elimina el espacio nulo escogiendo a x r como x . 
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Demostración la multiplicación por la matriz ortogonal U T deja sin cambio las longitudes: 

||Ax -¿|| = \\UTV J x -¿|| = ||£ V r x - U T b\\. 

Se introduce la nueva incógnita y = V T x = V~ l x, cuya longitud es la misma que x. Así, 
minimizar || Ax — ¿|| es lo mismo que minimizar || £y — U T ¿||. Ahora £ es diagonal y se 
conoce el mejor y + . Se trata dey + = T + U T b, de modo que el mejor x + es Vy + : 

Solución más corta x + = Vy + = VT + U r b = A + b. 

Vy + está en el espacio renglón, y A r Ax + = A T b proviene de la DVS. m 


Conjunto de problemas 6.3 

En los problemas 1 y 2 se calcula la DVS de una matriz singular cuadrada A. 

1. Calcule A r A y sus valores característicos a}, 0 y sus vectores característicos unitarios 


[2 8 J' 

2. a) Calcule AA T y sus valores característicos o}, 0 y sus vectores característicos unita¬ 

rios tq, Mj. 

b) Escoja signos de modo que Aiq — £,«, y compruebe la DVS: 

.2 g] = h “ 2 ] [*' o] I" 1 " 2 ] T - 

c) ¿Cuáles son los cuatro vectores que proporcionan bases ortonormales para C(A). 

N(A ), C(A t ), íV(A t )? 

En los problemas 3 a 5 se solicita la DVS de matrices de rango 2. 

3. Encuentre la DVS a partir de los vectores característicos u,, v 2 de A T A y Av¡ = <y¡u¡. 

Matriz de Fibonacci A = j ^ . 

4. Use la parte DVS del demo eigshow de MATLAB (o Java en la página del curso 
web .mit . edu/18.06) para encontrar gráficamente los mismos vectores iq y v 2 . 

5. Calcule A T A y AA T , así como sus valores característicos y vectores característicos uni¬ 
tarios para 

fl 1 0' 

A L° 1 !. ' 

Multiplique las tres matrices U £V T para recuperar A. 

Los problemas 6 a 13 abordan las ideas subyacentes de la DVS. 

6. Suponga que iq, y v¡,..., v n son bases ortonormales de R". Construya la ma¬ 

triz A que transforma cada Vj en para obtener Av¡ = u¡,. . . , Av„ = u n . 

7. Construya la matriz con rango 1 que tiene Av = 12 u para v = j(l, 1, 1, 1) y u = |(2, 
2, 1). Su único valor singular es <x¡ 

8. Encuentre U £V T si A tiene columnas ortogonales w¡, ... ,w n de longitudes eq. 


9. Explique cómo UT, V T expresa A como una suma de r matrices de rango 1 en la ecua¬ 
ción (3): A = aiiiivj + ■ ■ ■ + a r u r vj. 
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10. Suponga que A es una matriz simétrica de 2 por 2 con vectores característicos unitarios 
ui y « 2 . Sí sus valores característicos son A.j = 3 y X 2 = —2, ¿cuáles son U, £, y V‘? 

11. Suponga que A es invertible (con cr l > <r 2 > 0). Cambie A por una matriz lo más pe¬ 
queña posible para obtener una matriz singular Aq. Sugerencia: U y V no cambian: 


Encuentre A 0 , a partir de 


«1 U2 


«i «2] 


12. a) Si A cambia a 4A, ¿cuál es el cambio en la DVS? 
fe) ¿Cuál es la DVS para A T y A -1 ? 

13. ¿Por qué la DVS para A 4- / no utiliza simplemente £ + 7? 

14. Encuentre la DVS y la seudoinversa 0 + de la matriz cero de m por n. 

15. Encuentre la DVS y la seudoinversa V£ + í/ T de 


1 1 1 ll. 


0 1 0 
10 0’ 


1 1 
0 0 ' 


16. Si una matriz Q de m por n tiene columnas ortonormales, ¿cuál es g + ? 

17. Diagonalice A T A para encontrar su raíz cuadrada positiva definida S = V £ 1/2 V T y su 
descomposición polar A = QS: 


Vio L o 8j- 

18. ¿Cuál es la solución de longitud mínima por mínimos cuadrados x + = A + b de lo si¬ 
guiente? 

'1 0 0 ] fe] fo' 

Ax = 1 0 0 D = 2 . 

.1 1 !J L £ J L 2 

Es posible calcular A + , o encontrar la solución general para A T Ax = A T fe y escoger 
la solución que está en el espacio renglón de A. Este problema ajusta el mejor plano 
C + Dt + Ezetb — Oy también afe = 2enf = z = 0(yfe = 2ení = z = 1). 

19. a) Si A tiene columnas independientes, su inversa izquierda (A T A)~ l A r es A + . 
b) Si A tiene renglones independientes, su inversa derecha A T (AA T ) -1 es A + . 

En ambos casos, compruebe que x + = A + b está en el espacio renglón, y que A T Ax + 
= A T fe. 

20. Separe A = Í/£V T en su descomposición polar inversa QS'. 

21. La expresión {AB) + - 8 T A + , ¿siempre es verdadera para seudoinversas? Creo que 


22. Si se eliminan los renglones cero de U se queda con A = LJJ, donde las r columnas 

de L generan el espacio columna de A y los r renglones de U generan el espacio ren¬ 
glón. Así, A + tiene la fórmula explícita Lf~'L?. 

¿Por qué A + b está en el espacio renglón con t/ T al frente? ¿Por qué A T AA + fe = A T b, 
de modo que x + = A + b satisface la ecuación normal como debe hacerlo? 

23. Explique por qué AA + y A + A son matrices proyección (y por tanto simétricas). ¿So¬ 
bre qué subespacios fundamentales se proyectan? 
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6.4 PRINCIPIOS MINIMALES 

En esta sección nos escapamos por primera vez de las ecuaciones lineales. La incógnita x 
no se proporcionará como la solución de Ax = b o Ax = Ax. En vez de ello, el vector x se 
determinará por un principio mínimo. 

Es sorprendente la cantidad de leyes naturales que pueden expresarse como principios 
minimales. Justo el hecho de que los Equidos pesados se hunden hasta el fondo es una con¬ 
secuencia de minimización de su energía potencial. Y cuando una persona se sienta en un 
automóvil o se acuesta en una cama, los resortes se ajustan a sí mismos de modo que la 
energía se minimiza. Una pajilla en un vaso de agua se ve flexionada porque la luz llega al 
ojo lo más rápido posible. Ciertamente hay ejemplos más intelectuales: el principio funda¬ 
mental de la ingeniería estructural es la minimización de la energía total.* 

Es necesario mencionar de inmediato que estas “energías” no son otra cosa que fun¬ 
ciones cuadráticas positivas definidas. Y la derivada de una cuadrática es lineal. Volvemos 
a las conocidas ecuaciones lineales, cuando las primeras derivadas se igualaron a cero. El 
primer objetivo en esta sección es encontrar el principio mínimo equivalente a Ax — b, y 
la minimización equivalente a Ax = Xx. En dimensiones finitas se hará exactamente lo 
que la teoría de la optimización hace en un problema continuo, donde “primeras derivadas 
= 0” proporciona una ecuación diferencial. En todo problema, se tiene libertad de resolver 
la ecuación lineal o de minimizar la cuadrática. 

El primer paso es directo: se desea encontrar la “parábola” P(x) cuyo mínimo ocurre 
cuando Ax = b. Si A es justo un escalar, es fácil hacer lo anterior: 

La gráfica de P(x) = \ax 2 — bx tiene pendiente cero cuando —• — Ax — b — 0 . 

2 dx 

Este punto x = A~ l b es un mínimo si A es positiva. Así, la parábola P(x) se abre hacia arri¬ 
ba (véase la figura 6.4). En más dimensiones esta parábola se transforma en un tazón pa¬ 
rabólico (un paraboloide). Para asegurar un mínimo de P(x), no un máximo o un punto 
silla, ¡A debe ser positiva definida! 

6H Si A es positiva definida simétrica, entonces P(x) = ~x T Ax — x T fe alcanza su 
mínim o en el punto donde Ax = fe. En ese punto, P mfn = — |fe T A~~ 1 fe. 



Figura 6.4 La gráfica de una cuadrática positiva P(x) es un tazón parabólico. 


"Estoy convencido de que los vegetales y los humanos también se desarrollan según principios minimales- Qui¬ 
zá la civilización está basada en una ley de acción mínima. Debe haber nuevas leyes (y principios minimaíes) por 
descubrir en las ciencias sociales y en las ciencias de la vida. 




340 


Capítulo 6 Matrices positivas definidas 


Demostración Suponga que Ax = b. Para cualquier vector y, se demostrará que P(y) > 
P(x): 

P(y) — P(x ) = -y T Ay — y r b — -x T Ax + x T b 

j 1 

= -y T A>> — y T Ax + -x t Ax (iguale b = Ax) 

= i(y -x) r A(y -x). (1) 

Lo anterior no puede ser positiva definida porque A es positiva definida, y es cero sólo si 
y -x = 0. En todos los demás puntos, P(y) es más grande que P(x), de modo que el míni¬ 
mo ocurre en x. M 

Ejemplo 1 Minimizar P(x) = x\ - jcijc 2 + x\ - bix x - b 2 x 2 . El método de costumbre, por cálculo, 
es igualar a cero las derivadas parciales. Así se obtiene Ax = b: 

dP/dXi =2xi -Xi-bi =0 significa í 2 = M (2) 

dP/dx 2 = -Xi +2x 2 -b 2 =0 S [-1 2J [x 2 \ [b 2 y (2) 

El álgebra lineal reconoce esta P(x) como \x T Ax — x r b, y sabe de inmediato que Ax = b 

proporciona el mínimo. Se sustituye x = A~ l b en P(x): 


Valor mínimo 


^(A~ l b) T A(A~ x b) - (A~ l bfb = -l¡b T A~ l b. (3) 


En aplicaciones, ~x J Ax es la energía interna y -x T b es el trabajo externo. El sistema 
automáticamente se vuelve x = A~ 1 b, donde la energía total P(x) es un mínimo. 


Minimización con restricciones 

Muchas aplicaciones agregan ecuaciones extra Cx = d por encima del problema de mini¬ 
mización. Estas ecuaciones son restricciones. P(x) se minimiza sujeto al requerimiento 
adicional Cx = d. Por lo general x no es capaz de satisfacer n ecuaciones Ax = b y tam¬ 
bién l restricciones extra Cx = d. Se tienen demasiadas ecuaciones y se requieren i incóg¬ 
nitas más. 

Estas nuevas incógnitas y lt . . ., y¿ se denominan multiplicadores de Lagrange. In¬ 
tegran la restricción en una función IAx, y). Esta fue la brillante aportación de Lagrange: 

L(x , y) = P(x) + y T (Cx — d) = i x T Ax — x T b + x T C T y — y T d. 

El término en L se escoge exactamente de modo que dL/dy = 0 devuelva Cx — d. Cuan¬ 
do las derivadas de L se igualan a cero, se tienen n + i ecuaciones para n + l incógnitas 
xyy: 

Minimización dL/dx —0: Ax + C T y = b 

restringida dL/dy =0 : Cx =d ^ 

Las primeras ecuaciones implican las misteriosas incógnitas y. Bien podría preguntarse qué 
representan. Estas “incógnitas duales” y indican cuánto el mínimo restringido Pc/mín (qu® 
sólo permite a x cuando Cx = d) excede al P ^ no restringido (permitiendo todas las x): 

Sensibilidad del mínimo Pc/mín = Pmín + l¡y T (CA~ 1 b — d) > P mí „ . (5) 

Ejemplo 2 Suponga que P(xi,x 2 ) = \x\ + \x\. Ciertamente, su valor más pequeño es P^ = 0. 

Este problema no restringido tiene n = 2, A = I y b — 0. Así, la ecuación de minimización 
Ax = b justamente proporciona x¡ = 0 y x 2 = 0. 
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Ahora se agrega una restricción c¡ x, + c 2 x 2 = d. Esto coloca a x sobre una recta en 
el plano x r x 2 . El minimizador anterior x t = x 2 = 0 no está en la recta. La función la- 
grangiana L(x, y) = \x\ + \x\ + yftqx, + c 2 x 2 - d) tiene n + l = 2+1 derivadas 
parciales: 

dL/dxi =0 jcj + Ciy = 0 

dL/dx 2 =0 x 2 + c 2 y = 0 (6) 

dL/dy = 0 CiXi + c 2 x 2 ~ d. 

Al sustituir jq = — c,y y x 2 = —cyy en la tercera ecuación se obtiene ~cjy — c%y = d. 



El mínimo restringido de P = íx T x se alcanza en ese punto solución: 


1 C/mín - X-ii ^ -rx 2 ~ -—j- - -J—J ■ W 

2 2 2 (cf +c\) 2c\ +c¿ 

Lo anterior es igual a - \yd , como se pronosticaba en la ecuación (5), ya que b = 0 y 


En la figura 6.5 se muestra el problema que ha resuelto el álgebra lineal, si las restric¬ 
ciones mantienen a x sobre una recta 2x¡ —x 2 = 5. Se está buscando el punto más próxi¬ 
mo a (0, 0) sobre esta recta. La solución es x = (2, — 1). Se espera que este vector más 
corto x sea perpendicular a la recta, y se tiene razón. 



Mínimos cuadrados de nuevo 

En minimización, la gran aplicación son los mínimos cuadrados. El mejor x es el vector 
que minimiza el enror al cuadrado E 2 = || Ax — b\\ 2 . ¡Esta es una cuadrática y se ajusta a 
nuestro marco de referencia! Esclarecerá las partes que parecen nuevas: 

Error al cuadrado E 2 = (Ax - bf(Ax - b) = x T A r A x - 2 x T A J b + b T b. (9) 

Compare con ¿x T Ax — x r b al inicio de esta sección, que condujo a Ax = b: 

[A cambia a A r A] [b cambia a A T b] [se sumaf> T ft]. 

La constante b T b eleva toda la gráfica, lo cual no afecta al mejor x. Los otros dos cambios, 
A en A T A y b en A T 6, originan una nueva manera de llegar a la ecuación de mínimos cua- 
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drados (ecuación normal). La ecuación de minimización /be = b cambia a la 

Ecuación por mínimos cuadrados .4 Ax --Ah. ' 

El tema de la optimización requiere todo un libro. Nos detendremos mientras sea álgebra 
lineal pura. 

El cociente de Rayleigh 

El segundo objetivo es encontrar un problema de minimización que sea equivalente a Ax 
= Xx lo cual no es tan fácil. La función a minimizar no puede ser cuadrática, ya que en¬ 
tonces su derivada tendría que ser lineal, y el problema de valores característicos es no li¬ 
neal (X multiplicado por x). El truco exitoso es dividir una cuadrática entre otra: 

Cociente de Rayleigh Minimizar R(x) = 


61 Principio de .Rayleigh: El valor mínimo del cociente de Rayleigh es el me¬ 
nor valor característico X,. R(x) alcanza el mínimo en el primer vector característico 

‘ .y'.;.'.:-.;u v.yy / ; y' V'. y .y 

X\ ■ el©- Al. y t 4 Ti. 

. _ xjAx i __x;k\Xi _ ^ 

Mínimo donde Ax t = Xx t . R(x i) T '• 

x i •*] . 

>;• ■ y" y ; ■ .. . y... . • y- - . 


Si se mantiene x T Ax = 1, entonces R(x) es un mínimo cuando x T x = llx|| 2 es lo más gran¬ 
de posible. Se está buscando el punto sobre el elipsoide x T Ax = 1 lo más lejano posible al 
origen- el vector x de mayor longitud. Con base en el análisis que se hizo sobre el elipsoi¬ 
de,°su eje mayor apunta a lo largo del primer vector característico. Asi, R(x) es un mínimo 

Algebraicamente es posible diagonalizar la matriz simétrica A por medio de una ma¬ 
triz ortogonal: Q T AQ = A- Luego se hace x = Qy y el cociente se facilita: 


{QyYMQy) _ y 1 'Ay = y\ + • • • + L„y 2 
(Qy) r (Qy) y T y y\ + ■■■ + yl 


(ii) 


El mínimo de R es X,, en el punto en que y, - 1 y y 2 -~ 0: 

En todos los puntos Xi (yf + y\ + • • • + yl) < (*iy? + + " ' 


El cociente de Rayleigh en la ecuación (11) nunca es menor que X t y nunca es mayor que 
X„ (el mayor valor característico). Su mínimo está en el vector característico x x y su máxi¬ 
mo está en x n : 

X^AXn _ Xn ^ 

Máximo donde Ax n = R(x n ) - — yf- - A «- 

x n x n 


Un detalle pequeño pero importante: el cociente de Rayleigh es igual a a„, cuando el vec¬ 
tor ensayo es x = (1, 0,.... 0). Así, a„ (sobre la diagonal principal) está entre X t y X n .Bs- 
to puede verse en la figura 6.6, donde la distancia horizontal a la elipse (donde a n xd - i) 
está entre la distancia más corta y la distancia más larga: 




que es Xi < üh < X„. 


Los elementos diagonales de cualquier matriz simétrica están entre X t y X n . Para ver mas 
claramente lo anterior, la figura 6.6 se trazó para una matriz positiva definida de 2 por 2. 



Figura 6.6 Ambas, la x = Xy/y/X[ más alejada y la x = x n j-JT7 n más próxima propor¬ 
cionan x t Ax = x T Xx = 1. Estos son los ejes mayor y menor de la elipse. 


Entrelazamiento de los valores característicos 

Los vectores característicos intermedios x 2 ,..., x„_ x son puntos silla del cociente de Ray¬ 
leigh (derivadas cero, aunque ningún mínimo o máximo). La dificultad con estos puntos es 
que no se tiene ni idea de si R(x) está arriba o abajo de ellos. Esto hace más difícil de esti¬ 
mar a los valores característicos intermedios X 2 ,..., X„_,. 

Para este tópico opcional, la clave consiste en encontrar un mínimo o un máximo res¬ 
tringido. Las restricciones provienen de la propiedad básica de las matrices simétricas: x¡ 
es perpendicular a los otros vectores característicos. 



6J El mínimo de R(x) sujeto a x T x t = 0 es X 2 . El mínimo de R 
ra otra restricción.x T n = 0 no está por arriba de X 2 : 

X 2 = mín R(x) y X 2 > mín R(x) 


Este “principio máximo” hace de X 2 el máximo sobre todas las v del mínimo de R(x) con 
x T u = 0. Esto supone un método para estimar X 2 sin conocer X t . 


Ejemplo 3 Eliminar el último renglón y la última columna de cualquier matriz simétrica: 

X¡(A) = 2-V2 [2-1 0‘ 

X 2 (A) =2 A = —1 2—1 se convierte en B = 

X 3 (A)=2 + V2 L 0 —1 2 . 


2 -1] Xy{B) = 1 

-1 2 j X 2 (S) = 3. 


El segundo valor característico X 2 (A) = 2 está por arriba del menor valor característico 
Xj(j3) = 1. El menor valor característico X^A) = 2 — V2 está por abajo de X¡C6). Así, 
Xy(B) está atrapado entre ambos. 

En este ejemplo se escogió v = (0, 0, 1), de modo que la restricción x r v = 0 eliminó 
la tercera componente de x (reduciendo así A a B ). 


i 
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La fotografía completa es un entrelazamiento de valores característicos : 

X x (A) < X¡(B) < A-2(A) £ A.2(R) < * * • ;< ^-n-i(R) < A n (A). (13) 

Esto tiene una interpretación natural para un elipsoide, cuando es cortado por un plano que 
pasa por el origen. La sección transversal es un elipsoide de una dimensión menor. El eje 
mayor de esta sección transversal no puede ser más largo que el eje mayor de todo el elip¬ 
soide: \¡(B) > /. 1 (A). Sin embargo, el eje mayor de la sección transversal es por lo me¬ 
nos tan largo como el segundo eje del elipsoide original: X\{B) < X 2 (A). De manera 
semejante, el eje menor de la sección transversal es menor que el segundo eje original, y 
mayor que el eje menor original: X 2 (A) < X 2 {B) < X 3 (A). 

Lo mismo puede verse en mecánica. Cuando los resortes y las masas están oscilando, 
suponga que una masa se mantiene en equilibrio. Entonces la menor frecuencia se incre¬ 
menta, pero no por arriba de X 2 . La mayor frecuencia disminuye, pero no por debajo X„_¡. 
Se termina con tres observaciones. Espero que su intuición le indique que son correctas. 

Observación 1 El principio máximo se extiende a subespacios Sj de dimensión j: 

Máximo del mínimo X j+x = máx mío R(x) . (14) 

todas las Sj [xl Sj 

Observación 2 Para también hay un principio minimax: 

Mínimo del máximo X n -¡ = mín máxR(x) . (15) 

todas las Sj x±Sj 

Si j — 1, se está maximizando R(x) sobre una restricción x T v = 0. Este máximo está entre 
X„_i y X n no restringidas. La restricción más fuerte hace que x sea perpendicular al vector 
característico superior v = x n . Así, el mejor x es el siguiente vector característico x n _ l . El 
“mínimo de los máximos” es A.„_,. 

Observación 3 Para el problema generalizado Ax = XMx, los mismos principios se cum¬ 
plen si M es positiva definida. En el cociente de Rayleigh, x T x se convierte en x T Mx: 

Ax 

Cociente de Rayleigh Al minimizar R(x) = ~=-se obtiene ^(áí' 1 A). (16) 

x l Mx 

Incluso para masas desiguales en un sistema oscilatorio (M ¥= I), al mantener una masa en 
equilibrio se eleva la menor frecuencia y se disminuye la mayor frecuencia. 


|¡g Conjunto de problemas 6.4 

1. Considere el sistema Ax = b dado por 

2 —1 0] [x,] |"4' 

-1 2-1 x 2 = 0 . 

0-1 2 J [AjJ [4 

Construya la cuadrática correspondiente P(x u x 2 , x 3 ), calcule sus derivadas parciales 
dP/dx¡,y compruebe que se hacen cero exactamente en la solución deseada. 




6.4 Principios minimales 


2. Complete al cuadrado en P = ¿x T Ax -x T b = |(x -A l b) r A(x - A~ l b) + cons¬ 
tante. Esto es igual a P mín porque el término anterior nunca es negativo. (¿Por qué?) 

3. Encuentre el mínimo, en caso de haberlo, de _P¡ = |x 2 + xy + y 2 — 3y y P 2 = |x z 
— 3y. ¿Qué matriz A está asociada con P 2 ? 

4. (Repaso) Otra cuadrática que ciertamente tiene su mínimo en Ax = b es 

Q(x) — - II Ax —¿|| 2 = ^x T A T Ax — x T A r b + \jb í b. 

Al comparar Q con P , e ignorar la constante 1¿> T ¿, ¿qué sistema de ecuaciones se ob¬ 
tiene en el mínimo de Q1 ¿Cómo se denominan estas ecuaciones en la teoría de míni¬ 
mos cuadrados? 

5. Para cualquier matriz simétrica A, calcule la razón R(x ) para la elección especial x = 
(1,. . . , 1). ¿Cómo está relacionada la suma de todos los elementos a¡j con X l y /.,,? 

6 . Con A = [_ 2 2 ]’ encuentreunae l ecc ión de x con la que se obtenga un menor/?(;<:) 

que la cota X x ^ 2 que proviene de los elementos diagonales. ¿Cuál es el valor míni¬ 
mo de R(x)7 

1. Sí B es positiva definida, a partir del cociente de Rayleigh demuestre que el menor va¬ 
lor característico de A + B es mayor que el menor valor característico de A. 

8. Si y ju-j son los menores valores característicos de A y B, demuestre que el menor 
valor característico 9 X de A + B es por lo menos tan grande como X x + ¡x (Intente el 
correspondiente vector característico x en los cocientes de Rayleigh.) 

Nota Quizá los problemas 7 y 8 son los resultados más típicos y más importantes 
que resultan fácilmente del principio de Rayleigh, pero no es así en el caso de las ecua¬ 
ciones de valores característicos. 

9. Si B es positiva definida, a partir del principio minimax (12) demuestre que el segun¬ 
do menor valor característico se incrementa al sumar B : X 2 (A + B) > X 2 (A). 

10. Si se eliminan dos renglones y dos columnas de A, ¿qué desigualdades son de esperar 
entre el menor valor característico ¿i de la nueva matriz y los /.s originales? 


11. Encuentre los valores mínimos de 

R(x) = 

xf + XJ 


xf — x x x 2 + x 2 
2x1 + x 2 


12. A partir de la ecuación (11), demuestre que R(x) nunca es mayor que el mayor valor 
característico X n . 

13. El principio minimax para X¡ implica subespacios S¡ de dimensión j: 


Equivalente a la ecuación (15) 


X ¡ = mín máx R{x) 

S¡ x en S¡ 


a) Si Xj es positivo, deduzca que todo Sj contiene un vector x con R(x) > 0. 

b ) Deduzca que S, contiene un vector y = C~ l x con y T C T ACy/y T y > 0. 

c) Concluya que el j-ésimo valor característico de C r AC, con base en el principio mi¬ 
nimax, también es positivo, suponiendo de nuevo la ley de la inercia proporciona¬ 
da en la sección 6.2. 
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14. Demuestre que el menor valor característico A. t de Ax = XMx no es más largo que la 
razón a n /m n de los elementos en las esquinas. 

15. ¿Qué subespacio particular S 2 en el problema 13 proporciona el valor mínimo X 2 1 En 
otras palabras, ¿sobre qué S 2 se cumple que el máximo de R(x) es igual a A. 2 ? 

16. (Recomendado) A partir de la submatriz cero, decida los signos de los n valores carac¬ 
terísticos: 

'0 • 0 r 
„ • • 0 2 

A 0 0 0 • ’ 

12 ■ n 

17. (Mínimo restringido) Suponga que el mínimo sin restringir x = A~ x b satisface la 
restricción Cx = d. Compruebe que la ecuación (5) proporciona correctamente 
Pc/mía ~ Rmíni el término de corrección es cero. 


6.5 EL MÉTODO DEL ELEMENTO FINITO 

En la sección previa sobre principios mínimos se presentaron dos conceptos fundamentales: 

i) Resolver Ax: = b es equivalente a minimizar P(x) = ¿x T Ax — x T b. 

ii) Resolver Ax = X ¡x es equivalente a minimizar R(x) = x 1 Ax/x T x. 

A continuación se intentará explicar cómo es posible aplicar estas ideas. 

La historia es larga, ya que estos principios se conocen desde hace más de un siglo. 
En ingeniería, problemas como el doblado de planchas, o problemas de física como el es¬ 
tado fundamental (función característica) de un átomo, la minimización se ha utilizado pa¬ 
ra obtener una aproximación tosca a la solución verdadera. La aproximación tenía que ser 
tosca; las computadoras eran humanas. Los principios i) y ii) ahí estaban, aunque no era 
posible implementarlos. 

Resulta evidente que la computadora conllevaría una revolución. Lo que saltó hacia 
delante fue el método de diferencias finitas, ya que es fácil “discretizar” una ecuación di¬ 
ferencial. Ya en la sección 1.7, las derivadas se sustituyeron por diferencias. La región fí¬ 
sica es cubierta con una malla, y w" =fix) se convirtió en u¡+\ — 2 u¡ + u¡-\ = h 2 fj. En la 
década de 1950 surgieron nuevos métodos para resolver sistemas Au = / que eran muy 
grandes y ralos: actualmente los algoritmos y el hardware son mucho más rápidos. 

Lo que no se reconoció por completo fue que incluso las diferencias finitas se vuelven 
increíblemente complicadas para problemas ingenieriles reales, como las deformaciones 
que experimenta un avión. La verdadera dificultad no estriba en resolver las ecuaciones, 
sino en plantearlas. Para una región irregular el trozo de malla se colocó junto con trián¬ 
gulos, cuadriláteros o tetraedros. Luego se requirió un método sistemático para aproximar 
las leyes físicas subyacentes. La computadora tuvo que ayudar no sólo en la solución de 
Au =f y Ax = Xx, sino también en su planteamiento. 

Puede conjeturarse lo que ocurrió. Los antiguos métodos están de vuelta, con un nuevo 
concepto y un nuevo nombre. El nuevo nombre es método del elemento finito. La nueva idea 
utiliza más de la potencia de la computadora —en la construcción de una aproximación dis¬ 
creta, en su resolución y en el despliegue de los resultados— que cualquiera otra técnica en la 
computación científica.* Si la idea básica es simple, las aplicaciones pueden ser complicadas. 


1 



'Por favor, disculpe este entusiasmo; sé que el método puede no ser eterno. 
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ti. V -.. r- - ' ■■ :: n o cí i o a n a c i o n a l 

'." ’ El método del elementa finito 

^ Insf. PSFíSvnÁ :: ..-re. - cguciak;Zn del uruguay 

Para problemas en eátá escala,-ef úmcB^jfiuMqfi^M^fhiede discutirse es su costo; me temo 
que mil millones de dólares es una estimación conservadora del costo hasta la fecha. Es¬ 
pero que algunos lectores tengan el vigor necesario para dominar el método del elemento 
finito y utilizarlo correctamente. 


Funciones ensayo 

Empezando con el clásico principio de Rayleigh-Ritz, se introducirá la nueva idea de los 
elementos finitos. La ecuación puede ser -u" = fix) con condiciones en la frontera u(0) = 
u{ 1) = 0. Este problema es de dimensión infinita (el vector b se sustituyó por una función 
/, y la matriz A se convierte en -d 2 /dx 2 ). Es posible escribir la energía cuyo mínimo se bus¬ 
ca, al sustituir los productos intemos v T f por integrales de v(x) f(x): 

Energía total P(v) = p-u T At> — v r f — i f v(x)(—v"(x))dx — f v(x)f(x)dx. (1) 
2 2 Jo Jo 

P(v) debe minimizarse sobre todas las funciones v(x) que satisfacen v(0) = v(l) = 0 .La 
función que proporciona el mínimo es la solución u(x). La ecuación diferencial se ha con¬ 
vertido en un principio mínimo, y sólo queda integrar por partes: 

/■ 1 r I de p 1 * i 

/ v{-v")dx= {v') 2 dx ~[vv'Y x Zl raodo P( v ) = / ~(v'(x)) 2 + v{x)f{x) dx. 

Jo Jo que Jo L 2 

El término vt/es cero en ambos límites, ya que v lo es. Así, f (v'(x)) 2 dx es positiva, co¬ 
mo x r Ax. Se tiene garantizado un mínimo. 

El cálculo exacto del mínimo es equivalente a resolver exactamente la ecuación di¬ 
ferencial. El principio de Rayleigh-Ritz produce un problema n-dimensional al escoger 
sólo n funciones ensayo Vfix ),. .., V n (x). A partir de todas las combinaciones V = y¡ 
V¡(x) + • • • + y n V n (x) se busca la combinación particular (se denomina U) que minimiza 
P(V). Esta es la idea clave: minimizar sobre un subespacio de Vs en vez de sobre todas las 
v(x) posibles. La función que proporciona el mínimo es U(x). Es deseable y de esperar que 
U(x) esté próxima a la u(x) correcta. 

Al sustituir V por v, la cuadrática se convierte en 

P(VQ=I f (yi V[(x) +• • ■ + y n V^(x)) z dx — [ (yiVj(x)H- +y n V n (x))f(x)dx. (2) 

2 Jo 10 

Las funciones ensayo V se escogen de antemano. ¡Este es el paso clave! Las incógnitas y ( , 
. . . , y n van en un vector y. Luego, P(V) = jy T Ay — y T b se reconoce como una de 
las cuadráticas de costumbre. Los elementos A¿j de la matriz son / V' V- dx = coeficien¬ 
tes de yy/j. Las componentes b¡ son f V¡fdx. Ciertamente, es posible encontrar el míni¬ 
mo de ~y T Ay — y T b al resolver Ay = b. En consecuencia, el método de Rayleigh-Ritz 
consta de tres pasos: 

1. Escoger las funciones ensayo V),.. ., V„. 

2. Calcular los coeficientes A¡j y bj. 

3. Resolver Ay = b para encontrar U(x) = yiVfix) + • • - + y n V n (x). 

Todo depende del paso 1. A menos que las funciones V¡ (x) sean extremadamente sim¬ 
ples, los otros pasos serían virtualmente imposibles. Y a menos que alguna combinación de 
los Vj esté próxima a la solución u(x) verdadera, estos pasos serán inútiles. Para combinar 
la facilidad de hacer los cálculos y la exactitud, la idea clave que hace exitosos los elemen¬ 
tos finitos, es el uso de los polinomios por partes como las funciones ensayo V(x). 
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Elementas finitos lineales 

El elemento finito más simple y de mayor uso es lineal por partes. En los puntos interio¬ 
res x¡ = h, jc 2 = 2 h, . , . , x n = nh se colocan nodos, así como para las diferencias finitas. 
Luego, Vj es la “función sombrero” que es igual a 1 en el nodo x¿, y cero en todos los de¬ 
más nodos (véase la figura 6.7a). Está concentrado en un pequeño intervalo alrededor de 
su nodo, y es cero en todas las demás partes (incluyendo x = 0 y x = 1). Cualquier com¬ 
binación y\Vi + • • ■ + y„V„ debe tener el valor jj en el nodo j (los otros Vs son cero ahí), 
de modo que resulta fácil trazar su gráfica (véase la figura 6.7 b). 



0 xa, = 4h 1 0 1 

a) b) 

Figura 6.7 Funciones sombrero y sus combinaciones lineales. 


En el paso 2 se calculan los coeficientes A t ¡ = f V/Vj dx en la “matriz de rigidez” A. 
La pendiente Vj es igual a 1/h en el pequeño intervalo a la izquierda de x p y a -l/h en el 
intervalo a la derecha. Si estos “intervalos dobles ” no se traslapan, el producto V / Vj es ce¬ 
ro y A¡j = 0. Cada función sombrero se traslapa consigo misma y con sólo dos vecinos: 

-/(s) < " r+ /(4) Jx= í- 


En la diagonal 


J VjV'c 


Fuera de la 
diagonal 


.-/v/v;, 




Así, la matriz de rigidez es realmente tridiagonal: 


2 -1 

-1 2 -1 
-1 2 -1 
-1 2 -1 
-1 2 

¡Esto se ve como diferencias finitas! Ha conducido a miles de discusiones sobre la relación 
entre estos dos métodos. Elementos finitos más complicados —polinomios de grado supe¬ 
rior, definidos sobre triángulos o cuadriláteros para ecuaciones diferenciales parciales— 
también producen matrices ralas. Podría pensarse que los elementos finitos es una forma 
sistemática para construir ecuaciones en diferencias exactas sobre mallas irregulares. La 
cuestión esencial es la sencillez de estos polinomios por partes. Dentro de cada elemento, 
sus pendientes son fáciles de calcular e integrar. 

Las componentes b¡ en el miembro derecho son nuevas. En vez de simplemente con¬ 
tar con el valor de /en x¡, como para las diferencias finitas, ahora son un promedio de / 
alrededor de ese punto: bj — f V¡f dx. Luego, en el paso 3, se resuelve el sistema tri¬ 
diagonal Ay — b, que proporciona los coeficientes en la función ensayo minimizadora 
U = y i V¡ + • ■ • +y n V n - Al unir todas estas alturas y } con una recta quebrada, se obtiene la 
solución aproximada U(x). 
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Ejemplo 1 — u" = 2 con u( 0) = «(1) = 0, y solución u(x) = x -x 2 . 

La aproximación usa tres intervalos y dos funciones sombrero, con h — |. La matriz 
A es de 2 por 2. El miembro derecho requiere integración de la función sombrero multipli¬ 
cada por/(x) = 2. Lo anterior produce el doble del área j bajo el sombrero: 



La solución de Ay = b es y — (§, §)• Lamejorf/(x) es|V[ + | V 2 , que es igual a | en los 
puntos de la malla. Esto coincide con la solución exacta u(x) = x — x 2 = | 

En un ejemplo más complicado, la aproximación no es exacta en los nodos. Aunque 
está extraordinariamente próxima. La teoría subyacente es explicada en el libro del autor 
An Analysis ofthe Finite Element Method (consulte la página www. wellesleycambridge 
. com) escrito al alimón con George Fix. En otros libros se proporcionan aplicaciones más 
detalladas, y el tema de los elementos finitos se ha convertido en una parte importante de 
la educación de la ingeniería. Se aborda en Introduction to Applied Mathematics, y también 
en mi nuevo libro Applied Mathematics and Scientific Computing. Ahí se analizan ecua¬ 
ciones diferenciales parciales, donde el método realmente se encuentra en su medio. 


Problemas de valores característicos 


El concepto de Rayleigh-Ritz -minimizar sobre una familia de dimensión finita de Vs en 
lugar de hacerlo sobre todas las vs admisibles- también es de utilidad para los problemas 
de valores característicos. El verdadero mínimo del cociente de Rayleigh es la frecuencia 
fundamental A t . Su mínimo aproximado A, es más grande, ya que la clase de funciones 
ensayo se ha restringido a los Vs. Este paso era completamente natural e inevitable: aplicar 
las nuevas ideas del elemento finito a esta forma variacional del problema de valores ca¬ 
racterísticos establecida hace bastante. 

El mejor ejemplo de un problema de valores característicos tiene u(x) — sen ttx y 

A-¡ = 7T 2 : 

Función característica u{x) —u" = Xu, con n(0) = «(1) = 0. 


Esta función sen ttx minimiza el cociente de Rayleigh v l Av/v T v: 


Cociente de Rayleigh 


fj v(x)(—v"(x)) dx 

R(v) = Jo , - 

f 0 (v(x)) 2 dx 


Jo(v'(x)) 2 dx 

J¿(v(x)) 2 dx 


Esta es una razón de energía potencial a energía cinética, y están en equilibrio en el vector 
característico. Normalmente este vector característico es desconocido, y para aproximarlo 
es necesario admitir sólo los candidatos de ensayo V = yi V x + • • • + y„ V n : 


t/\ _ /oOhV,' + • • • +y„Vj) 2 dx _ y 1 Ay 

tv( V J i rr> _ _ • 

fo(yiV¡ +■•• +y n V n ) 2 dx y T M y 


A continuación se aborda el problema matricial: Minimizar y T Ay/y T My. Con M = I, lo 
anterior conduce al problema de valores característicos estándar Ay = Xy. Sin embargo, la 
matriz M es tridiagonal, ya que la aproximación a esta función se traslapa. Es exactamente 
la situación que conlleva el problema generalizado de valores característicos. El valor mí¬ 
nimo Aj es el menor valor característico de Ay = XMy. Esta A¡ está próxima a (y por 
arriba de) ti 2 . El vector característico y proporciona la aproximación U = y\ V¡ + • ■ ■ +. 
y n v n a la función característica. 
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Así como en el problema de estática, el método puede resumirse en tres pasos: 1) es¬ 
coger los Vj, 2) calcular A y Ai, y 3) resolver Ay = XMy. No sé por qué esto cuesta mil mi¬ 
llones de dólares. 

Conjunto do problemas 6.5 

1. Use tres funciones sombrero, con h = j, para resolver —u" = 2 con u( 0) = w( 1) = 0. 
Compruebe que la aproximación U coincide con u = x - x 2 en los nodos. 

2. Resuelva -u" = x con w(0) = n(l) = 0. Luego resuelva aproximadamente con dos 
funciones sombrero y h = 5 . ¿Dónde está el error más grande? 

3. Suponga que -u" = 2, con la condición en la frontera w(l) = 0 cambiada a «'(1) = 0. 
Esta condición “natural” sobre u no requiere ser impuesta sobre las funciones ensayo 
V. Con h = }, existe un semisombrero extra l/ 3 , que va de 0 a 1 entre x = § y x = 1. 
Calcule A 33 = / (V3') 2 dx y = f 2 V 3 dx. Resuelva Ay = /para la solución del ele¬ 
mento finito y l v l + y 2 V 2 + y 3 V 3 . 

4. Resuelva -u" = 2 con una sola función sombrero, pero coloque su nodo en.t = 7 en 
vez de x = |. (Trace esta función V/) Con condiciones a la frontera u(0) = «(1) = 0, 
compare la aproximación por elementos finitos con la u = x - x 2 verdadera. 

5. El método de Galerkin empieza con la ecuación diferencial (por ejemplo — u" = f(x)) 
en vez de con la energía P. La solución ensayo sigue siendo u = yi V x + y 2 V 2 + — + 
y n V n , y las ys se escogen para hacer que la diferencia entre —u" y/sea ortogonal para 
todo V,-: 

Galerkin J (-y, V" -y 2 V"-y„ V") V¡ dx = J f(x) Vj (x) dx. 

Integre por partes el miembro izquierdo para llegar a Ay = / demostrando que el mé¬ 
todo de Galerkin proporciona las mismas Ay f que Rayleigh-Ritz para problemas si¬ 
métricos. 

6 . Una identidad fundamental para cuadráticas demuestra y = A~' 1 b como la minimiza- 
ción de: 

P(y) = ~y T Ay — y L b — i(y — A" 1 £>) T A(y — A~ l b ) — ^b T A~ l b. 

El mínimo sobre un subespacio de funciones ensayo está en la y más próxima a A~ l b. 
(Esto hace lo más pequeño posible al término de la derecha; constituye la clave para 
la convergencia de Í7 a u.) Si A = / y b = (1, 0, 0), ¿qué múltiplo de V = (1, 1, 1) 
proporciona el menor valor para P(y) = |y T y ~ yi? 

7. Para una simple función sombrero V(x) centrada en x = 5 , calcule A = /(V ') 2 dx y 
M = f V 2 dx- En el problema de valores característicos de 1 por 1 , ¿X = A/A/ es 
mayor o menor que el verdadero valor característico X = ir 2 ? 

8 . Para las funciones V¡ y V 2 centradas enx = /i = j y x = 2 h = |, calcule la matriz 
masa de 2 por 2 M¡¡ = / V¡ V, dx, y resuelva el problema de valores característicos 
Ax = XMx. 

9. ¿Cuál es la matriz masa M¡¡ ~ f V¡ Vj dx para n funciones sombrero con h = ? 
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Los dos primeros métodos son iterativos, y el último es directo. Hace su trabajo en un 
número finito de pasos, aunque no termina con los valores característicos en sí. Esto pro¬ 
duce una matriz mucho más simple de utilizar en los pasos iterativos. 

3. El número de condición de una matriz. En la sección 7.2 se intenta medir la “sen¬ 
sibilidad” de un problema: si A y B se modifican ligeramente, ¿cuán grande es el efecto so¬ 
bre x = A~ l b? Antes de abordar esta pregunta, se requiere un método para medir A y el 
cambio A A. La longitud de un vector ya se ha definido, y ahora se necesita la norma de 
una matriz. Luego el número de condición, y la sensibilidad de A se concluyen al multi¬ 
plicar las normas de A y A -1 . Las matrices de este capítulo son cuadradas. 


W 7.2 NORMA DE UNA MATRIZ Y NÚMERO DE CONDICIÓN 

Un error y una metedura de pata son cosas muy distintas. Un error es una pequeña equivo¬ 
cación, quizá inevitable incluso para un matemático perfecto o una computadora perfecta. 
Una metedura de pata es mucho más seria, y por lo menos un orden de magnitud mayor. 
Cuando la computadora redondea un número después de 16 bits, eso es un error. Pero cuan¬ 
do un problema es tan espantosamente sensible que este error de redondeo cambia por 
completo la solución, entonces casi con toda seguridad alguien ha metido la pata. Nuestro 
objetivo en esta sección es analizar el efecto de los errores con la finalidad de evitar las me¬ 
tedoras de pata. 

En realidad, se está continuando un análisis que empezó en el capítulo 1 con 


A = 


1 1 

1 1.0001 


0.0001 f 
1 1 . ■ 


Se afirmó que B está bien acondicionada, y no es particularmente sensible al redondeo, ex¬ 
cepto que si la eliminación gaussiana se aplica de manera imprudente, entonces la matriz 
se vuelve completamente vulnerable. Una metedura de pata es aceptar a 0.0001 como el 
primer pivote, por lo que es necesario insistir en una elección más grande y segura, me¬ 
diante un intercambio de renglones de B. Cuando “pivoteo parcial” se integra al algoritmo 
de eliminación, la computadora busca automáticamente los pivotes más grandes. Así, la re¬ 
sistencia natural al error por redondeo deja de estar comprometida. 

¿Cómo se mide esta resistencia natural, y se decide si una matriz está bien acondicio¬ 
nada o mal acondicionada? Si hay un cambio ligero en b o en A, ¿cuán grande es el cam¬ 
bio que esto produce en la solución x? 

Se empieza con un cambio en el miembro derecho, de b a b + Sb ■ Este error podría 
deberse a los datos experimentales o al redondeo. Puede suponerse que Sb es pequeño, pe¬ 
ro su dirección está fuera de nuestro control. La solución ha cambiado de x a x + Sx: 


Ecuación de error A(x + 8x) — b + Sb, de modo que, por sustracción, A(Sx) = Sb. (1) 

Un error Sb conduce a Sx = A~'á¿>. En la solución x hay un gran cambio cuando A~ l es 
grande, A es casi singular. El cambio en x es especialmente grande cuando Sb apunta en la 
dirección que es más amplificada por A -1 . 

Suponga que A es simétrica y que sus valores característicos son positivos: 
0 < Ai < ■ ■ ■ < X„. Cualquier vector Sb es una combinación de los vectores característi¬ 
cos unitarios correspondientes x¡, . . . , x n . El peor error Sx, que proviene de A -1 , es en la 
dirección del primer vector característico x¡: 

c- Sb 

Si Sb = ex u entonces Sx = —. 


Peor error 


( 2 ) 


7.2 Norma de una matriz y número de condición 
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El error ||áé|| es amplificado por l/X ly que es el mayor valor característico de A ~ l . Esta 
amplificación es máxima cuando A.j está próximo a cero, y A es casi singular. 

Medir la sensibilidad completamente, por medio de A-! tiene una seria desventaja. Su¬ 
ponga que todos los elementos de A se multiplican por 1000. Así, X , se multiplica por 1000 
y la matriz se verá mucho menos singular. Esto ofende nuestro sentido del juego justo; un 
reescalamiento tan simple no puede corregir a una matriz mal acondicionada. Es cierto que 
Sx será 1000 veces menor, pero lo mismo ocurre a la solución x = A" l ¿. El error relativo 
||<5x||/|| jc|| será el mismo. Al dividir entre ||x||, el problema vuelve a normalizarse contra un 
cambio trivial de escala. Al mismo tiempo hay una normalización para Sb. Nuestro proble¬ 
ma es comparar el cambio relativo ||áft||/||6|| con el error relativo ||&c|¡/||x||. 

El peor de los casos es cuando ||áx|| es grande —con Sb en la dirección del vector ca¬ 
racterístico x¡ —, y cuando ||x|| es pequeña. La verdadera solución x debe ser lo más peque¬ 
ña posible en comparación con la b verdadera. Esto significa que el problema original 
Ax = b debe estar en el otro extremo, en la dirección del último vector característico x„: si 
b — x n , entonces x — A~ l b — b/X „. 

Es esta combinación, b — x n , y Sb = ex¡, lo que hace al error relativo lo más grande 
posible. Estos son los casos extremos en las siguientes desigualdades: 



7A Para una matriz positiva definida, la solución x = A 
siempre satisfacen 


número de condición de una matriz positiva definida A 


Ejemplo 1 Los valores característicos de A son aproximadamente X x = 10 4 /2 y X 2 = 2: 

A — j | OOqj tiene número de condición aproximado de c = 4 - 10 4 . 

Debe esperarse un cambio brusco en la solución debido a los cambios normales en los da¬ 
tos. En el capítulo 1 se compararon las ecuaciones Ax = b y Ax' = b': 

u + v — 2 u + v = 2 

u + l.OOOlv =2 u + l.OOOlu = 2.0001. 


Los miembros derechos sólo han cambiado por ||á¿>|| = 0.0001 = 10 4 . Al mismo tiempo, 
la solución vaden = 2, i> = 0aM = ti = 1. Este es el error relativo de 


IIMI 

11 * 1 ! 


IK-l, Dll = V2 
||(2,0)|! 2 ’ 


que es igual a 


2 ■ 10 4 


\\Sb\\ 
II ¿>11 


Sin haber hecho ninguna elección especial de la perturbación, en la solución se observa un 
cambio relativamente grande. Las x y Sb forman ángulos de 45° con los peores casos, lo 
cual explica el 2 faltante entre 2 • 10 4 y la posibilidad extrema c = 4 • 10 4 . 


Si A = / o incluso si A = //10, su número de condición es c = X máx /X min = 1. Por 
comparación, el determinante es una medida terrible del mal acondicionamiento. Depen¬ 
de no sólo del escalamiento, sino también del orden n: si A = 1/ 10, entonces el determi¬ 
nante de A es lO - "". De hecho, esta matriz “casi singular” está lo mejor acondicionada 
posible. 
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Ejemplo 2 La matriz diferencia finita A de n por n tiene A máx » 4 y X^ n?/n 2 : 



El número de condición es aproximadamente c(A) = \n 2 -, y esta vez la dependencia res¬ 
pecto al orden n es genuina. Mientras mejor se aproxime a — u" — f incrementando el nú¬ 
mero de incógnitas, más difícil es calcular la aproximación. En cierto punto de intersec¬ 
ción, un incremento en n produce en realidad una respuesta más deficiente. 

Afortunadamente para el ingeniero, esta intersección ocurre donde la precisión es bas¬ 
tante buena. Al trabajar con precisión simple, una computadora típica podría hacer errores 
por redondeo del orden de 1CT 9 . Con n = 100 incógnitas y c = 5000, el error se amplifica 
cuando mucho, de modo que es del orden de 10 ~ 5 , lo cual sigue siendo más preciso que 
cualquier medición normal. Sin embargo, con 10 000 incógnitas se tiene un problema, o con 
una aproximación 1, —4, 6 , —4, 1 a d 4 u/dx 4 = /(x), para la cual el número de condición 
crece con n 4 .* 


Matrices no simétricas 

Hasta el momento, nuestro análisis ha sido aplicado a matrices simétricas con valores ca¬ 
racterísticos positivos. La hipótesis de positividad puede abandonarse fácilmente, y usar 
sólo valores absolutos ¡Á|. Pero para ir más allá de la simetría, como ciertamente se quie¬ 
re, debe haber un cambio fundamental. Esto puede verse fácilmente para las matrices bas¬ 
tante no simétricas 



100 ' 

1 



(4) 


Todos los valores característicos son iguales a la unidad, aunque el número de condición 
idóneo no es k m& Jk mSa — 1. El cambio relativo en x no está acotado por el cambio relati¬ 
vo en b. Compare 



Un cambio de 1 % en b ha producido un cambio centenario en x; el factor de amplificación 
es 100 2 . Debido a que c representa una cota superior, el número de condición debe ser por 
lo menos 10 000. La dificultad aquí es, que un gran elemento fuera de la diagonal en A sig¬ 
nifica un elemento igualmente grande en A~ ! . A menudo es erróneo esperar que A -1 se ha¬ 
ga más pequeña a medida que A se hace más grande. 

Para una definición idónea del número de condición, se considera nuevamente la ecua¬ 
ción (3). Se está intentando hacer pequeño ary grande a b — Ax. Cuando A no es simétri¬ 
ca, el máximo de II Ax || /||x || puede encontrarse en un vector x que no es uno de los vectores 
característicos. Este máximo es una excelente medida del tamaño de A. Es la norma de A. 


* La regla empírica, comprobada experimentalmente, es que la computadora puede perder log c ci¬ 
fras decimales debido a los errores de redondeo en la eliminación gaussiana. 
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a de .4 es el número (4 j definido por 

- ll¿*ll i 

IIA || = max If so . 

II-til 

En otras palabras, j|A|) acota al “poder de amplificación” de la matriz: 
|| Ax|| < || A || |lx|| para todos los vectores x. 


Las matrices A y A ” 1 en la ecuación (4) tienen normas ubicadas en alguna parte entre 
100 y 101. Es posible calcularlas exactamente, pero primero se desea completar la relación 
entre las normas y los números de condición. Debido a que b = Axy Sx = A~ x 8 b, la ecua¬ 
ción ( 6 ) proporciona 

11*11 < IIA||||;e|| y II Sx || < |¡A~ l ||p¿>||. (7) 

Esta es la sustitución de la ecuación (3), cuando A no es simétrica. En el caso en que es si¬ 
métrica, ¡IA ¡I es la misma que y ||A _1 || es lo mismo que 1/X^. La sustitución correc¬ 
ta para X tnáll /X mín es el producto ||A||||A -1 ||, que es el número de condición. 

7C El número de condición de A es c = ||Aj|||A L )|. El error relativo satisface 

Sx a partir de Sb Mil < c Mil directamente de la ecuación (7). (S) - 

II* || 11*11 

Si se perturba la matriz A en vez del miembro derecho b, entonces 


113*11 ^ .. II3A|| directamente de la ecuación ( 10 ) ^ 

||x + Sx || — || A || que se muestra a continuación. 


Sx a partir de SA 

% "-¿i i: v \ 


Lo que es extraordinario es que el mismo número de condición aparece en la ecuación (9), 
cuando se perturba la matriz misma: Si Ax = b y (A + SA)(x + Sx) = b, entonces por 
sustracción 

ASx + 8 A(x + Sx) =0, o Sx = -A“ l (SA)(x + Sx). 

Al multiplicar por SA se amplifica un vector por no más de ||5A||, y al multiplicar por A~ 1 
se amplifica por no más de |¡A -I ||. Luego, ||Sx|| < ¡|A~ 1 |||¡SA¡|||x + Sx||, que es 

-MML < ||A- l |IPA|| (10) 

II* +3*11 IIA || 

Estas desigualdades significan que el error por redondeo proviene de dos fuentes. Una 
es la sensibilidad natural del problema, medida por c. La otra es el error verdadero Sb o 
SA. Esto constituyó la base del análisis de error de Willdnson. Debido a que la eliminación 
realmente produce factores aproximados L’ y U ', resuelve la ecuación con la matriz erró¬ 
nea A + SA = L’IT , en vez de hacerlo con la matriz correcta A = LU. Willdnson demos¬ 
tró que el pivoteo parcial controla SA, de modo que la carga del error por redondeo es 
llevada por el número de condición c. 

Una fórmula para la norma 

La norma de A mide la mayor cantidad por la cual cualquier vector (vector característico o 
no) es amplificado por la matriz multiplicación: ||A|| = máx (||Ax||/||x||). La norma de la 
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matriz identidad es 1. Para calcular la norma, ambos miembros se elevan al cuadrado para 
llegar a la A T A simétrica: 


|| A || 2 = máx - 


x T A T Ax 


7D ||A|| es la raíz cuadrada del mayor valor característico de A T A:||A|1 2 = 
X r „ áK (A T A) . El vector que A amplifica más, es el vector característico correspondien¬ 
te de A t A: 


x t A t Ax x T (X máx x) 


b mix (A T A) = II A|| 2 . 


En la figura 7.1 se muestra una matriz no simétrica con valores característicos A,! = 
X 2 = 1 y norma ||A|| = 1.618. En este caso A -1 tiene la misma norma. Los puntos más 
alejado y más próximo Ax sobre la elipse provienen de los vectores característicos de A T A, 
no de A. 


1 +v'S 
2 


A T A = 


elipse total de Ax 



7 l¡A|| 2 = X máx (A T A). 
l/||A _l || 2 = A raín (A T A) . 
c(A) = ¡|A||||A- 1 || > 


círculo ||a;|| = 1 


2.618 

0.382 

(1.618) 2 


Figura 7.1 Las normas de A y A 1 provienen de la Ax más larga y más corta. 

Nota 1 La norma y el número de condición no se calculan realmente en la práctica, sino 
que sólo se estiman. No hay tiempo para resolver un problema de valores característicos 
para X mix (A T A). 

Nota 2 En la ecuación por mínimos cuadrados Á l Ax = A r b, el número de condición 
c(A T A) es el cuadrado de c(A). Al formar A T A, un problema sano puede convertirse en uno 
enfermo. Quizá sea necesario ortogonalizar A con el proceso de Gram-Schmidt, en vez de 
calcularla con A T A. 

Nota 3 Los valores singulares de A en la DVS son las raíces cuadradas de los valores 
característicos de A T A. Por la ecuación (12), otra fórmula para la norma es ||A|| = cr m4x . 
Las matrices ortogonales U y V dejan sin cambio las longitudes en ||Ax|| = ||í/£V’ T x||- 
Así, el mayor ||Ax||/||x|| proviene del mayor o en la matriz diagonal E. 

Nota 4 El error por redondeo también entra en Ax = Xx. ¿Cuál es el número de condi¬ 
ción del problema de valores característicos? El número de condición de la matriz de dia- 
gonalización S mide la sensibilidad de los valores característicos. Si ¡J. es un valor 
característico de A + E, entonces su distancia a uno de los valores característicos de A es 


'A| < ||S|| ||5- 


:c(S)||£j|. 


(13) 
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Con vectores característicos ortonormales y 5 = Q, el problema de valores característicos 
está perfectamente acondicionado: c(Q) = 1. El cambio SX en los valores característicos no 
es mayor que el cambio SA. En consecuencia, el mejor de los casos es cuando A es simétri¬ 
ca, o más generalmente, cuando AA T = A T A. Entonces A es una matriz normal; su S diago- 
nalizadora es una Q ortogonal (véase la sección 5.6). 

Si x k es la Á:-ésima columna de S y y k es el i-ésimo renglón de S~ x , entonces X k cam¬ 
bia por 

8 X k = y k Ex k + términos de orden ||£j| 2 . (14) 

En la práctica, y k Ex k es una estimación realista de 8 X. La idea en todo buen algoritmo es 
mantener la matriz error E lo más pequeña posible —usualmente al insistir, como se hará 
en la siguiente sección, en matrices ortogonales en cada paso del cálculo de X. 

BE Conjunto de problemas 7.2 

1. Para una matriz ortogonal Q, demuestre que \\Q\\ = 1 y también que c(Q) = 1. Las 
matrices ortogonales (y sus múltiplos aQ) son las únicas matrices perfectamente acon¬ 
dicionadas. 

2. ¿Qué “famosa” desigualdad proporciona ||(A + B)x\\ < II Axil + II Bx ||, y por qué se 
concluye de la ecuación (5) que ||A + fi|| < || A|| + ||B||? 

3. Explique por qué || A Bx || < ||A|| ||£|| ||x||, y concluya de la ecuación (5) que ||A£|| < 
||A||||jS]|. Demuestre que esto también implica c(AB) < c(A)c(B). 

4. Para la matriz positiva definida A = j^_ 2 j]> calcule ||A _1 || = 1/A.i, ||A|| = X 2 , 

y c(A) = X 2 /X¡. Para un miembro derecho b y una perturbación 8b de modo que el 
error sea el peor posible, ||<5x||/||x|| = cl|áí>||/||¿>||- 

5. Demuestre que si X es cualquier valor característico de A, Ax = Xx, entonces ||a|| < 

IIA ||. 

6 . Las matrices en la ecuación (4) tienen normas entre 100 y 101. ¿Por qué? 

7. Compare los valores característicos de A T A y AA T , para demostrar que ||A|| = ||A T ||. 

8 . Para una matriz positiva definida A, la descomposición de Cholesky es A = LDlJ = 
R t R, donde R = ~J~DL l . A partir de la ecuación (12), demuestre directamente que el 
número de condición de c(R) es la raíz cuadrada de c(A). La eliminación sin intercam¬ 
bios de renglones no puede afectar a una matriz positiva definida, ya que c(A) = 
c(R T )c(R). 

9. Demuestre que máx|X| no es una norma verdadera, encontrando contraejemplos de 2 
por 2 para X m ¿ x (A + S) < ?- m ¿ x (A) + /. m .¿ x (B) y X m .^ 7 (AB) < X m ¿ x (A)X m ¿ x (B). 

10. Demuestre que los valores característicos de B = j^ T q ] son = * =<T ¡’ * os va l° res sin¬ 
gulares de A. Sugerencia: Intente B 2 . 

11. a) Ay A -1 , ¿tienen el mismo número de condición c? 

b) En paralelo con la cota superior ( 8 ) sobre el error, demuestre una cota inferior: 

------ > i (Considere A~ l b = x en vez de Ax = b .) 

11*11 _ c ||¿|| 
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12. Encuentre las normas X máx y los números de condición X^/X^ de las siguientes ma¬ 
trices positivas definidas: 


'100 0 ' 


'2 r 


'3 r 

0 2 _ 


1 2 . 


1 l . 


13. Encuentre las normas y los números de condición, a partir de las raíces cuadradas de 
¿máx(A T A) y A mXn (A T /l): 


'-2 0' 


"1 ll 


i r 

0 2 


O 

o 


— 1 i 


14. Demuestre que el número de condición ||A|| ||A 1 1| es por lo menos 1. 

15. ¿Por qué I es la única matriz positiva definida simétrica que cumple ^*máx ^"mín ^ 2 

Así, las únicas matrices con ||A|| = 1 y ||A -1 || = 1 deben cumplir A T A = I. Son ma¬ 
trices _. 

16. Las matrices ortogonales tienen norma \\Q\\ = 1. Si A = QR, demuestre que ||A|| < 
\\R\\ y también que ||i?H < ||A||. Así, ||A|| = ||0||||/?||. Encuentre un ejemplo de A = 
LU con || A || < \\L\\\\U\\. 


17. (Sugerido por Moler y Van Loan) Calcule b - Ay y b - Az cuando 


0.217' 

A — 

_°.254 

r\ — 


0.780 

0.913 


0.563 

0.659 


0.341 

-0.087 


z = 


0.999 

- 1.0 


Para resolver Ax = b, ¿y está más próximo que z? Conteste en dos formas: Compare 
el residuo b - Ay con b - Az. Luego compare y y z con el verdadero x = (1, -1)- Al¬ 
gunas veces se desea un residuo pequeño, y algunas veces, un 8 x pequeño. 

Los problemas 18 a 20 son sobre normas vectoriales distintas a la norma de costum¬ 
bre ||x|| = y/x • X . 

18. La “norma £ l ” es ||x||i = |x t | + • - - + ¡x„\. La “norma £°°” es Meo = máx |x f |. 
Calcule ||x||, MU, y MI», para los vectores 

*=(1,1, 1,1,1) y x= (0.1, 0.7, 0.3, 0.4, 0.5). 


19. Demuestre que MI,*, es ||x|| e£ ||x||,. A partir de la desigualdad de Schwarz, demuestre 
que las razones ||x||/||x||oo y IMIi/lM nunca son mayores que JTl- ¿Con qué vector 
(*!,..., x„) se obtienen razones iguales a Jñl 

20. Todas las normas vectoriales deben cumplir la desigualdad del triángulo. Demuestre 
que 

II* +y||oo < IIXII oo+ 11 y Iloo y II* + ylh < ll*lh + llylli- 


21. Por eliminación, calcule la inversa exacta de la matriz de Hilbert A. Luego, calcule de 
nuevo A -1 redondeando todos los números hasta tres cifras: 


En MATLAB: A = h¡lb(3) 



i 

3 
1 

4 
1 

5 


22. Para la misma A, calcule i? = Axparax= (1, 1, l)y* = (0,6, —3.6). Un cambio pe¬ 
queño A b produce un gran cambio Ax. 


23. Calcule X máx y X^ para la matriz de Hilbert de 8 por 8 a¡j = l/( i + j - 1 ). Si Ax = 
b con || ¿||= 1, ¿cuán grande puede ser ||*||? Si el error por redondeo de b es menor 
que 10 ~ 16 , ¿cuán grande es el error que esto puede provocar en *? 

24. Si se conocen L, U, Q, y R, ¿qué es más rápido resolver, LUx = b o QRx = bl 

25. Escoja el pivote más grande disponible en cada columna (pivoteo parcial), para facto- 
rizar cada A en PA = LU: 


A = 


1 

2 


0 

2 



0 

2 

2 


1 

0 

0 


26. Encuentre la factorización LU de A = |J } j. En su computadora, resuelva por eli¬ 
minación cuando e = 10~ 3 , 1CT 6 , 10~ 9 , 10~ 12 , 10 —15 : 


€ 

f 


[*>! 

: 

‘1 +e 

1 

i 


A 2 J 


2 


El * verdadero es (1, 1). Elabore una tabla para mostrar el error para cada e. Intercam¬ 
bie las dos ecuaciones y vuelva a resolver: los errores casi deben desaparecer. 


W 7.3 CÁLCULO DE VALORES CARACTERÍSTICOS 


No hay ninguna forma mejor que otra para encontrar los valores característicos de una ma¬ 
triz. Sin embargo, ciertamente existen algunas formas terribles que nunca deben intentar¬ 
se, así como también algunas ideas que merecen un sitio permanente. Empezamos con la 
descripción de un método bastante fácil y aproximado: el método de potencias, cuyas pro¬ 
piedades de convergencia son fáciles de comprender. Para demostrar este método en ac¬ 
ción, en la página del curso web.mit.edu/ 18.06 se agregó una animación gráfica (sonora). 

De manera continua nos dirigimos hacia otro algoritmo más complicado, que empie¬ 
za por hacer tridiagonal a una matriz simétrica y termina por hacerla virtualmente diago¬ 
nal. Este segundo paso se realiza repitiendo el proceso de Gram-Schmidt, por lo que se 
denomina método QR. 

El método de potencias normal opera, con base en el principio de una ecuación en 
diferencias. Empieza con una conjetura inicial u 0 y sucesivamente forma u { = Au 0 , u 2 = 
Au t y en general u k ~\ = Au k . Cada paso es una multiplicación matriz-vector. Luego de k 
pasos produce u k = A k u n , aunque la matriz A k nunca aparece. La cuestión esencial es que 
la multiplicación por A debe ser fácil —si la matriz es grande, mejor sería si fuese rala— 
debido a que la convergencia al vector característico a menudo es muy lenta. Suponiendo 
que A tiene un conjunto completo de vectores característicos x,, ...,*„, el vector u k está 
dado por la fórmula de costumbre: 

Vectores característicos ponderados por X* u k ~ c\X\xx + ■ ■ ■ +c n X k n x n . 


Suponga que el valor característico más grande X n es todo en sí: no hay otro valor caracte¬ 
rístico de la misma magnitud, y |x^ <••■<[ X„_!| < |X„|. Entonces, a medida que la 
conjetura inicial u 0 contenía alguna componente x n del vector característico, de modo que 
c n 0 , esta componente domina gradualmente en u k : 

A / \ \ k 


«i 

X* 


Cl 


*1 + 


+ C n 


X n -1 

X” 


X n -\ + c n x n . 


( 1 ) 
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Los vectores u k apuntan cada vez con mayor precisión hacia la dirección de x n . Su factor 
de convergencia es la razón r = |A„_i 1/ |A„|. Es justo como la convergencia hacia un esta¬ 
do estacionario, para una matriz de Markov, excepto que ahora X„ puede no ser igual a 1. 
El factor de escalamiento X k n en la ecuación (1) evita que u k se vuelva muy grande o muy 
pequeño, en caso de que |A„| > 1 o |X„| < 1. 

A menudo apenas es posible dividir cada u k entre su primera componente a k antes 
de continuar con el paso siguiente. Con este simple escalamiento, el método de potencias 
u k +1 = Aujct k converge a un múltiplo de x n . Los factores de escalamiento a k tienden a X„ 


Ejemplo 1 El u k tiende al vector característico 


de movimientos de población en la sección 1.3: 


cuando A 


es la matriz 



Si r = |A„_,|/ |A„| es próximo a 1, entonces la convergencia es muy lenta. En muchas 
aplicaciones r > 0.9, lo cual significa que para alcanzar un dígito más se requieren más de 
20 iteraciones. (En el ejemplo se tenía r = 0.7, y aun así era lenta). Si r = 1, lo que signifi¬ 
ca ¡7,„_i | = | X„|, entonces es probable que la convergencia ni siquiera ocurra. Esto sucede 
(en el paquete sonoro) para un par conjugado complejo A„-.> — X n . Hay varias formas de 
evitar esta limitación. A continuación se describen tres. 


1. El método de potencias en bloque funciona con varios vectores a la vez, en lugar de 
u k . Si p vectores ortonormales se multiplican por A, y luego para ortogonalizarlos se 
aplica de nuevo el proceso de Gram-Schmidt —lo cual es un solo paso del método— 
entonces la razón de convergencia se convierte en r' = \X n - p \l |A„|. Se obtendrán 
aproximaciones para p valores característicos distintos y sus vectores característicos. 

2. El método de potencias inverso opera con A ~ 1 en vez de A. Un simple paso es v k+1 = 
A~h 4 , lo cual significa que se resuelve el sistema Av k+l = v k (¡y se ahorran los fac¬ 
tores L y UV) En este caso se converge al valor característico más pequeño A., y su vec¬ 
tor característico x u en el supuesto de que |Ai| < |A 2 |. A menudo, lo que se requiere 
en las aplicaciones es X u y entonces la iteración inversa es una opción automática. 

3. El método de potencias inverso desplazado es el mejor de todos. A se sustituye por 
A — al. Cada valor característico es desplazado por a, y el factor de convergencia pa¬ 
ra el método inverso cambia a r" = |A| — a\¡\X 2 — a]. Si a es una aproximación 
aceptable a /, t , entonces r" es muy pequeño y la convergencia se acelera enormemen¬ 
te. Cada paso del método resuelve (A — al)w k+l = w k : 

ClXi c 2 x 2 c n x„ 

W le — -r "r -7 *r * * * +-—-- . 

(A.j - a) k (X 2 - a) k ( X n - a) k 

Cuando a está próximo a A-!, el primer término domina sólo al cabo de uno o dos pa¬ 
sos. Si X x ya se ha calculado con algún otro algoritmo (como QR), entonces a es este 
valor calculado. Un procedimiento normal es factorizar A — a/ en LU y resolver 
Ux í = (1, 1, . . ., 1) por sustitución hacia atrás. 

Si A! no se ha aproximado aún, entonces el método de potencias inverso desplazado 
debe generar su propia elección de a. Es posible hacer variar a = a k en cada paso si así se 
desea, de modo que A — a k I)w k+i = w k . 
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Cuando A es simétrica, una opción bastante precisa es el cociente de Rayleight 
desplazado por a k = R(w k ) = 

W Wk 

Este cociente R(x) tiene un mínimo en el vector característico verdadero . Su gráfica es 
como el fondo de una parábola, de modo que el error A x = a k es aproximadamente el cua¬ 
drado del error del vector característico. Los factores de convergencia |Ai — o:* | /1X 2 — a k \ 
en sí convergen a cero. Así, estos desplazamientos de cocientes de Rayleigh proporcionan 
una convergencia cúbica de a k a k l .‘ 


Formas tridiagonaies y de Hessenberg 

El método de potencias es razonable sólo para una matriz grande y rala. Cuando demasia¬ 
dos elementos son distintos de cero, este método es un error. En consecuencia, se plantea 
la pregunta de si existe alguna forma sencilla de crear ceros. Este es el objetivo de los pá¬ 
rrafos siguientes. 

Puede afirmarse que después de calcular una matriz semejante Q~ l AQ con más ceros 
que A, no se intenta regresar al método de potencias. Hay variantes mucho más poderosas, 
y parece que la mejor es el algoritmo QR. (El método de potencias inverso desplazado tie¬ 
ne su sitio al final, para encontrar el vector característico.) El primer paso es producir rápi¬ 
damente tantos ceros como sea posible, usando una matriz ortogonal Q. Si A es simétrica, 
entonces también lo es Q~ l AQ. Ningún elemento puede hacerse peligrosamente grande 
porque Q preserva la longitud. 

Para pasar de A a Q~ ¡ AQ, hay dos posibilidades principales: Es posible producir un 
cero en cada paso (como en la eliminación), o puede trabajarse con toda una columna a la 
vez. Para un simple cero, es fácil utilizar una rotación del plano como se ilustra en la ecua¬ 
ción (7), que se encuentra cerca del final de esta sección, que tenga a eos 6 y sen 9 en un 
bloque de 2 por 2. Luego, puede ciclarse a través de todos los elementos por debajo de la 
diagonal, escogiendo en cada paso una rotación 6 que produzca un cero; este es el método 
de Jacobi. Fracasa en diagonalizar A después de un número finito de rotaciones, ya que los 
ceros de pasos previos se destruyen cuando se crean ceros posteriores. 

Para preservar los ceros y detenerse, es necesario plantear lo anterior para menos que 
una forma triangular. La forma de Hessenberg acepta una diagonal distinta de cero por 
abajo de la diagonal principal. Si una matriz de Hessenberg es simétrica, entonces sólo 
tiene tres diagonales distintas de cero. 

Una serie de rotaciones en los planos idóneos produce los ceros requeridos. Househol- 
der encontró una nueva manera de obtener exactamente lo mismo. Una transformación de 
Householder es una matriz reflexión, determinada por un vector v: 


Matriz de Householder H = I — 2-. 

IMF 


A menudo, v se normaliza para convertirlo en un vector unitario u = v/ 1| v ¡i > y entonces H 
se transforma en I — 2 uu T . 


* Convergencia lineal significa que cada paso multiplica el error por un factor fijo r < 1. Convergen¬ 
cia cuadrática significa que en cada paso el error se eleva al cuadrado, como en el método de New- 
ton x k+l — x k — —f(x k )/f'(x k ) para resolver/( jc) = 0. La convergencia cúbica requiere de 10 1 a 
10" 3 a 10 ~ 9 . 
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En cualquier caso, H es tanto simétrica como ortogonal. 

H T H = (I — 2 uu T )(I — 2uu t ) = / — 4«k t + 4 uu T uu r = /. 

Así, H = H r = H~ l . El plan de Householder era producir ceros con estas matrices, y su 
éxito depende de la siguiente identidad Hx = —az: 

7E Suponga que z és el vector columna ( 1 , 0,. .., 0), a = ||*||, y v = x + az. En¬ 
tonces Hx = —az = (—a, 0, . . . , 0). El vector Hx termina en ceros, como se queríá.' 


La demostración consiste en calcular Hx y llegar a —az: 

,, 2 vv T x , , s 2 (x + 

Hx = x - ■■ ■ ■■ = x - O + crz)—— -—--- 

l|n || 2 (x + <rz) T (x + az) 

= x — (x + az) (porque x T x = a 2 ) 


Esta identidad puede utilizarse de inmediato, sobre la primera columna de A. A la 
QT ‘A<2 final le permite una diagonal diferente de cero abajo de la diagonal principal (for¬ 
ma de Hessenberg). En consecuencia, sólo participan los elementos que están estrictamen¬ 
te debajo de la diagonal: 

"£¡2i i rn r-a- 

«31 0 „ 0 n \ 

x = . , z = . , Hx — L>) 


En este punto la matriz H de Householder es sólo de orden n — 1, de modo que está incrus¬ 
tada en la esquina inferior derecha de una matriz l/j de tamaño completo: 


1 0 0 0 0 
0 

0 H 
0 
0 


í/f'AÍ/, = 


Esta primera etapa está completa, y U l ~ l AU¡ tiene la primera columna requerida. En la se¬ 
gunda etapa, x consta de los n — 2 últimos elementos en la segunda columna (tres estrellas 
en negritas). Así, H 2 es de orden n — 2. Cuando está incrustada en U 2 , produce 


1 0 0 0 0 
0 10 0 0 


U~ l (U~' AU 1 )U 1 = 


0 * * * 

o o * * 

o o * * 


U 3 se encargará de la tercera columna. Para una matriz de 5 por 5, se alcanza la forma de 
Hessenberg (tiene seis ceros). Como regla general, Q es el producto de todas las matrices 
UyU-i ■ ■ • U n - 2 . y el número de operaciones necesarias para calcularla es de orden n 3 . 
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"1 0 0 ] [ 1-1 0 ' 

Q = 0 0 -1 , Q~ l AQ = -1 0 1 . 

0 -1 OJ [011 


Q~ l AQ es una matriz que ya está lista para revelar sus valores característicos: el algoritmo 
QR está listo para comenzar, aunque a continuación se hace una digresión para mencionar 
otras dos aplicaciones de estas mismas matrices H de Householder. 


1. Lafactorización de Gram-Schmidt A = QR. Recuerde que R ha de ser triangular su¬ 
perior. Ya no es necesario aceptar una diagonal distinta de cero extra abajo de la dia¬ 
gonal principal, ya que no hay matrices multiplicando por la derecha que estropeen los 
ceros. El primer paso en la construcción de Q es trabajar con toda la primera columna 
de A: 


v=x + \\x\\z, H\ = l — 2——t. 

IMÍ 2 

La primera columna de H¡A es igual a — ||x||z. Es cero abajo de la diagonal principal, 
y es la primera columna de R. El segundo paso trabaja con la segunda columna de 
HyA, desde el pivote hacia abajo, y produce una H 2 H ] A que es cero abajo de ese pivo¬ 
te. (Todo el algoritmo es como la eliminación, aunque ligeramente más lento.) El re¬ 
sultado de n — 1 pasos es una matriz triangular superior R, aunque la matriz que 
registra los pasos no es una triangular inferior L. En vez de lo anterior, es el producto 
O = Hi H 2 ■ ■ ■ H n -\, que puede almacenarse en esta forma factorizada (sólo se pre¬ 
servan los us) y nunca se calcula explícitamente. Así se completa el proceso de Gram- 
Schmidt. 

2. La descomposición del valor singular U T AV = 2. La matriz diagonal 1 tiene la mis¬ 
ma forma que A, y sus elementos (los valores singulares) son las raíces cuadradas de 
los valores característicos de A T A. Debido a que las transformaciones de Househol¬ 
der sólo pueden preparar el problema de valores característicos, no es de esperar que 
produzcan 2. En vez de ello, producen de manera estable una matriz bidiagonal , con 
ceros en todas partes, excepto a lo largo de la diagonal principal y la diagonal arriba 
de ésta. 

El primer paso hacia la DVS es exactamente como en QR arriba: x es la primera co¬ 
lumna de A, y H x x es cero abajo del primer pivote. El paso siguiente es multiplicar por la 
derecha por una Lfi 1 '’ que produzca ceros, como se indica a lo largo del primer renglón: 



A —> H\A — 


* * * * 

0 * * * 

0 * * * 


-* HiAH a) 


?{? Jfc o 0 

§ * * * 

0 * * * 


(4) 
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Luego, dos transformaciones de Householder alcanzan rápidamente la forma bidiagonal: 


**00 
= 0 * * * 
0 0 ** 


y H 2 H l AH (l) H ( - 2) 


**00 
0**0 
0 0 ** 


ES algoritmo Üñ para calcular valores característicos 

El algoritmo es casi mágicamente sencillo. Empieza con A 0 , la factoriza en Q 0 R 0 con el 
proceso de Gram-Schmidt, y luego invierte los factores: A-¡ = R 0 Q 0 . La nueva matriz A, 
es semejante a la original porque Q,J l A 0 Q 0 = Qo 1 (QoRo)Qo = Ai-Así, el proceso con¬ 
tinúa sin cambio en los valores característicos: 

Toda A/c es igual A k - Q k R k y entonces A k+] = R k Q k . ( 5 ) 

Esta ecuación describe el algoritmo QR no desplazado , y casi siempre A k tiende a una for¬ 
ma triangular. Sus elementos diagonales tienden a sus valores característicos, que también 
son los valores característicos de A 0 . Si ya existía algún procesamiento para obtener la for¬ 
ma tridiagonal, entonces A 0 está relacionada con la A absolutamente original, mediante 
Q~ X AQ — A 0 . 

Como está, el algoritmo QR es bueno pero no tanto. Para hacerlo especial, requiere dos 
refinamientos: es necesario permitir desplazamientos a A k — a k I, y debe asegurarse que la 
factorización QR en cada paso sea muy rápida. 

1, E! algoritmo desplazado. Si el número a k está muy próximo de un valor caracte¬ 
rístico, el paso en la ecuación (5) debe desplazarse de inmediato por a k (lo cual cambia 

Qk y RkY- 

A k — a k I = Q k R k y entonces A k+l = R k Q k + a k I. ( 6 ) 

Esta matriz A k+ * es semejante a A k (siempre los mismos valores característicos): 

Qk 1 AkQk = Qk l (Q k Rk + oc k I)Q k = A k +¡. 

Lo que ocurre en la práctica es que el elemento (n, rí) de A¿ el que está en la esquina infe¬ 
rior derecha, es el primero en tender a un valor característico. Ese elemento es la elección 
más simple y conocida para el desplazamiento a k . Normalmente esto produce convergencia 
cuadrática, y en el caso simétrico incluso convergencia cúbica, al menor valor característi¬ 
co. Al cabo de tres o cuatro pasos del algoritmo desplazado, la matriz A k se ve como sigue: 


con 6 « 1 . 


El Xj se acepta como una aproximación muy próxima al Xj verdadero. Para encontrar el 
siguiente valor característico, el algoritmo QR continúa con la matriz más pequeña (de 3 
por 3, en la ilustración) en la esquina superior izquierda. Sus elementos subdiagonales se 
reducen algo en los primeros pasos QR, y otros dos pasos son suficientes para encontrar X 2 . 
Así se obtiene un procedimiento sistemático para encontrar todos los valores característi¬ 
cos. De hecho, el método QR ya está descrito por completo. Sólo queda encontrar los vec- 


* 

* 

* 

* 

* 

* 

* 

* 

0 

* 

* 

* 

0 

0 

€ 

Mj 
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dos por Householder. 

2. Cuando A 0 es tridiagonal o de Hessenberg, cada paso QR es muy rápido. El proceso 
de Gram-Schmidt (factorización en QR) requiere 0(n 3 ) operaciones para una matriz com¬ 
pleta A. Para una matriz de Hessenberg, lo anterior se vuelve en 0(n 2 ), y para una matriz 
tridiagonal, es 0(n). Por fortuna, cada nueva A k está nuevamente en forma de Hessenberg 
o tridiagonal: 


2o es de Hessenberg 


Puede comprobarse fácilmente que esta multiplicación deja a Q 0 con los mismos tres ce¬ 
ros que A 0 . Una matriz de Hessenberg multiplicada por una matriz triangular es una ma¬ 
triz de Hessenberg. Lo mismo es cierto para una matriz triangular multiplicada por una 
matriz de Hessenberg: 


A j es de Hessenberg 


Ai — RqQo 


El c aso simétrico es todavía mejor, ya que A! = Qo‘A 0 Qo = 2o A o2o permanece simé¬ 
trica. Por el razonamiento que acaba de presentarse, Aj también es de Hessenberg. Así, A! 

debe ser tridiagonal. Lo mismo es válido para A 2 , A 3 .y cada paso QR empieza con 

una matriz tridiagonal. 

El último punto es la factorización en sí, que produce las Q k y R k a partir de cada A k 
(o realmente, de A k — <x k l). Householder puede usarse de nuevo, pero es más sencillo aniqui¬ 
lar cada elemento subdiagonal a la vez, mediante una “rotación del plano” Py. La primera 
es P 2l : 


ir» . . ^ „ . acuo tus t7 uo l ^ ^ ^ 

Rotación para eliminar a a 2i P 2 i-^k “ i n (?) 

X j 47 'fc fjs ¡js 

1 j 0 0 * * 

El elemento (2, 1) en este producto es a n sen 6 + a 2 \ eos 0, y se escoge el ángulo 6 que 
hace cero esta combinación. La siguiente rotación P 32 se elige de forma semejante, para 
eliminar el elemento (3, 2) de P 32 P 2 l A k . Después de n — 1 rotaciones, se tiene R 0 : 

Factor triangular R k = ■ - • P 32 P 2 l A k . (8) 

Más información acerca de este extraordinario algoritmo para cálculos científicos, puede 
encontrarse en libros sobre álgebra lineal numérica. Se menciona un método más: Amoldi 
en ARPACK, para matrices grandes. Ortogonaliza la sucesión de Krilov x, Ax, A 2 x, ..., me¬ 
diante el proceso de Gram-Schmidt. Si requiere los valores característicos de una matriz 
grande, ¡no use det(A — X/)! 


Conjunto de problemas 7.3 

1. Para la matriz A = í _j j » con valores característicos X t = 1 y X 2 = 3, aplique tres 
veces el método de potencias u k+1 = Au k a la conjetura inicial uo = [¿] • ¿Cuál es el 
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2. Para ia misma A y la conjetura inicial u 0 = [ 3 ], compare tres pasos de potencias in¬ 
versos con un paso desplazado con a — UqAu 0 /UqUq: 

u k o bien, u — (A — aI)~ l uo- 

El vector limitante 14 , ahora es un múltiplo del otro vector característico (1, 1). 

3. Explique por qué |A„/A controla la convergencia del método de potencias de cos¬ 
tumbre. Construya una matriz A para la que este método no converge. 

4. La matriz de Markov A = j £ 7 ] tiene X = 1 y 0.6, y el método de potencias u k = 

A k u 0 converge a [" q "25 ] - Encuentre los vectores característicos de A -1 . ¿A qué converge 
el método de potencias inverso U- k = A~ k u 0 (después de multiplicar por 0.6*)? 

5. Demuestre que para dos vectores distintos de la misma longitud, ||x|| = ||y||, la trans¬ 
formación de Householder con v = x — y proporciona Hx = y y Hy = x. 

6. Calcule o = \\x ||, v = x + az, y H = 1 — 2vv T /v r v . Compruebe Hx = -ax: 



7. Use el problema 6 para encontrar la H AH 1 tridiagonal que es semejante a 

1 3 4' 

3 10. 

4 0 0_ 

8 . Demuestre que empezando con Ao = £ 2 ]’ algoritmo QR sin desplazar sólo 

produce la modesta mejoría A 1 = 5 [ i* \ j. 

9. Aplique a la siguiente matriz A un solo paso QR con el desplazamiento a = a 22 , que 
en este caso significa sin desplazamiento, ya que a 22 = 0. Demuestre que los elemen¬ 
tos fuera de la diagonal van de sen 9 a -sen 3 9, que es convergencia cúbica. 

eos 9 sen 6 
sen 9 0 

10. Compruebe que el algoritmo QR no modifica la matriz tridiagonal A = £ ° ¿ j. Es uno 
de los (raros) contraejemplos de la convergencia (por lo que se desplaza). 

11. Demuestre por inducción que, sin desplazamientos, (2o 2 1 • ■ • Qk)(.Rk ■ • ■ R 1 R 0 ) es 
exactamente la factorización QR de A k+l . Esta identidad relaciona QR con el método de 
potencias y conduce a una explicación de su convergencia. Si |A. t | > ¡X 2 | > ••• > |L„¡, 
estos valores característicos aparecen gradualmente sobre la diagonal principal. 

12. Escoja sen 9 y eos 9 en la rotación P para triangularizar A, y encuentre R: 




u k +i — A l u k 


1 _ [2 1 

3 1 2 


Pi\A = 


eos 9 —sen 9 
sen 9 eos 9 


1 -1 
3 5 


* * 
0 * 


= R. 


u 1 i ? 3 
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13. Escoja sen 9 y eos 6 para hacer triangular a P 2l A P 2 ~¡‘ (misma A). ¿Cuáles son ios va¬ 
lores característicos? 

14. Cuando A se multiplica por P tJ (rotación del plano), ¿qué elementos cambian? Cuan¬ 
do P,j se multiplica por la derecha por P¡¿ 1 , ¿qué elementos cambian ahora? 

15. ¿Cuántas multiplicaciones y cuántas sumas se usan para calcular PA? (Una organiza¬ 
ción cuidadosa de todas las rotaciones proporciona ín 3 multiplicaciones y sumas, lo 
mismo que para QR por reflectores y el doble que para LU.) 

16. (Giro de una mano robot) Un robot produce cualquier rotación A de 3 por 3, a partir 
de rotaciones del plano alrededor de los ejes x, y, y z. Si P 32 P 31 P 21 A = /.las tres 
vueltas del robot están en A = P 2 I P3l l P 32*- Los tres ángulos son ángulos de Euler. 
Escoja la primera 9 de modo que 


eos# 

—sen# 

O O 
- 1 

>1 H- 

'-1 

2 

2 ' 

sen# 

eos# 

2 

-1 

2 es cero en la posición ( 2 , 1 ) 

0 

0 


2 

2 

- 1 _ 


7.4 MÉTODOS ITERATIVOS PARA Ax = b 

En contraste con los valores característicos, para los cuales no hay opción, en absoluto se 
requiere un método iterativo para resolver Ax — b. La eliminación gaussiana llega a la so¬ 
lución x en un número finito de pasos (n 3 /3 para una matriz completa, menos para las gran¬ 
des matrices que se encuentran en realidad). A menudo este número es razonable. Cuando 
es enorme, quizá convenga detenerse en una x fija que pueda obtenerse más rápido, y en¬ 
tonces ya no es de utilidad aplicar parcialmente la eliminación y luego detenerse. 

Nuestro objetivo es describir métodos que empiecen desde cualquier conjetura inicial 
x 0 , y obtener una aproximación mejorada x k+) a partir de la x k previa. Es posible detener¬ 
se donde se quiera. 

Es fácil inventar un método iterativo al separar la matriz A. Si A = 5 — T, entonces 
la ecuación Ax = b es la misma que Sx = Tx + b. En consecuencia, puede intentarse 

Iteración desde x k hasta x k+1 Sx k +, = Tx k + b. (1) 

No hay garantía de que este método funcione. Una separación exitosa S — T satisface dos 
requisitos: 

1. El nuevo vector x k+l debe ser fácil de calcular. En consecuencia, S debe ser una ma¬ 
triz sencilla (¡e invertible!); puede ser diagonal o triangular. 

2 . La sucesión x k debe converger a la solución verdadera x. Si la iteración en la ecuación 
(1) se resta de la ecuación verdadera Sx = Tx + b, el resultado es una fórmula que im¬ 
plica sólo los errores e k — x — x k : 

Ecuación error Se k+ \ = Te k . (2) 

Ésta es justo, una ecuación en diferencias. Empieza con el error inicial e 0 , y luego de 
k pasos produce el nuevo error e k = (S~ l T) K eo- La cuestión de convergencia es exac¬ 
tamente la misma que la cuestión de estabilidad: x k —> x exactamente cuando e k —> 0. 
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7F El método iterativo en la ecuación (1) es convergente si y sólo si todo valor ca¬ 
racterístico de saisface \X < 1. Su razón de convergencia depende del tama¬ 
ño máximo de [A.¡: 

Radio espectral “rho” p(S~ l T) = máx jA.,¡. (3) 

.. i V. ■ . 


Recuerde que una solución típica de e k +¡ =5 1 T e k es una combinación de vectores ca¬ 
racterísticos: 

Error después de k pasos e k = c\k\x\ + • • ■ + c n \ n x n . (4) 

El mayor |X¡| termina por ser dominante, de modo que el radio espectral p = 1X^1 gobier¬ 
na la razón a la que e k converge a cero. Ciertamente, se requiere p < 1. 

Los requisitos 1 y 2 son contradictorios. Es posible alcanzar convergencia absoluta con 
5 = & y x = 0; el primer y único paso de la iteración debe ser Ax¡ = b. En ese caso la ma¬ 
triz error S~ l Te s cero, sus valores característicos y el radio espectral son cero, y la razón 
de convergencia (que suele definirse como — log p) es infinita. Pero Ax x ~b puede ser di¬ 
fícil de resolver; ésa fue la razón para separar. A menudo una elección simple de S puede 
ser exitosa, y se empieza con tres posibilidades: 


1. 5 — parte diagonal de A (método de Jacobi). 

2. S = parte triangular de A (método de Gauss-Seidel). 

3. S — combinación de 1 y 2 {sobrerrelajamiento sucesivo o SRS). 


S también se conoce como preacondicionador, y su elección es crucial en análisis numé¬ 
ricos. 


Ejemplo t 


(Jacobi) Aquí S es la parte diagonal de A: 


A = 


2 

-1 





1 

0 


S~ l T = 


0 


i 


L 2 



Si las componentes de x son v y w, el paso de Jacobi Sx k +\ = Tx k + b es 



= w k + b 1 , . 

, 0 bien. 

V 


’o 

1 ' 
2 


V 

+ 

V 2 

2w k+ \ 

= V k + í>2. 

w 

ifc-H 

1 

. 2 

0 


w 

k 

J b 2 /2 


La matriz decisiva S~ X T tiene valores característicos ±|, que significa que el error se re¬ 
duce a la mitad (un dígito binario más se vuelve correcto) a cada paso. En este ejemplo, 
que es demasiado pequeño para ser típico, la convergencia es rápida. 


Para una matriz A más grande, hay una dificultad muy práctica. La iteración de Ja¬ 
cobi requiere mantener todas las componentes de x k hasta que se ha completado el 
cálculo de x k+1 . Una idea mucho más natural, que sólo requiere la mitad de almacena¬ 
miento, es empezar utilizando cada componente de la nueva x k+ x tan pronto como es 
calculada; x k+x toma el lugar de x k una componente a la vez. Entonces x k puede destruir¬ 
se en cuanto x k+ x es creada. La primera componente queda como antes: 

Nueva Xj a u(*i)*+i = a nx 2 ~ < 213*3 — • • • —a Xn x„) k + b x . 
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El paso siguiente opera inmediatamente con este nuevo valor de x x , para encontrar (* 2 ) 1 :+- ¡ * 

Nueva x 2 a 22 {x 2 ) M = -a 2l {xx) M + (-a 23 x 3 - • • • - a 2 „x n ) k + b 2 . 

Y la última ecuación en el paso de iteración usa exclusivamente nuevos valores: 

Nueva x„ a nn (x n ) M = (-a nl x x - a n2 x 2 - a nn - ix„_¡)*+i + b n . 

Esto se denomina método de Gauss-Seidel, aunque aparentemente Gauss no lo conocía y 
Seidel no lo recomendaba. Esto es parte de una historia sorprendente, ya que no es un mal 
método. Cuando los términos en x k+ x se muevan al miembro izquierdo, S se ve como la par¬ 
te triangular inferior de A. En el miembro derecho, T es estrictamente triangular superior. 


Ejemplo 2 


(Gauss-Seidel) Aquí S l T tiene valores característicos menores: 


2 

-f 


2 

0' 


‘0 

r 


'0 i' 

.- 1 

2 

, S = 

-1 

2 
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Un simple paso del método de Gauss-Seidel lleva las componentes v k y 
2v k+l = w k +b x 
2w k+x = v k+ i + b 2 


o bien. 
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0 ' 


‘0 

f 

-1 

2 _ 

rifc+i = 

0 

0 


x k 


w k en 
+ b. 


Los valores característicos de S~ l T son £ y 0. El error se divide entre 4 cada vez, de mo¬ 
do que un solo paso de Gauss-Seidel amerita dos pasos de Jacobi. Debido a que ambos 
métodos requieren el mismo número de operaciones —simplemente se utiliza el nuevo va¬ 
lor en vez del anterior, y realmente ahorra almacenamiento— el método de Gauss-Seidel 
es mucho mejor. 

Esta regla se cumple en muchas aplicaciones, aun cuando hay ejemplos en los que el 
método de Jacobi converge y Gauss-Seidel fracasa (o a la inversa). El caso simétrico es di¬ 
recto: cuando todos los a u > 0, Gauss-Seidel converge si y sólo si A es positiva definida. 

Durante la época en que los cálculos se hacían manualmente se descubrió (tal vez acciden¬ 
talmente) que la convergencia es más rápida si se va más allá de la corrección x k+1 — x k 
de Gauss-Seidel. En términos generales, estas aproximaciones quedan en el mismo lado de 
la solución x. Un factor de sobrerrelajamiento (o nos acerca más a la solución. Con w = 
1, se recupera Gauss-Seidel; con cu > 1, el método se conoce como sobrerrelajamiento su¬ 
cesivo (SRS). La elección óptima de a> nunca es mayor que 2. A menudo está en la vecin¬ 
dad de 1.9. 

Para describir el sobrerrelajamiento, sean D, L, y U las partes de A sobre, abajo y arri¬ 
ba de la diagonal, respectivamente. (Esta separación no tiene nada que ver con la A = LDU 
de la eliminación. De hecho, ahora se tiene A = L + D + U. ) El método de Jacobi tiene 
S = D en el miembro izquierdo y T = — L — U en el miembro derecho. El método de Gauss- 
Seidel escoge S = D + Ly T = —U. Para acelerar la convergencia, nos movemos a 
Sobrerrelajamiento [D + íoL]x m = [(1 + co)D - coU]x k + <ob. 

(5) 

Sin importar co, la matriz de la izquierda es triangular inferior y la de la derecha es triangu¬ 
lar superior. En consecuencia, x k+1 puede seguir sustituyendo a x k , componente a compo¬ 
nente, tan pronto como es calculada. Un paso típico es 

a«(x ¡) k +i = a¡i{x¡) k +&>[(-a n x 1 -a ¡i _ 1 x ¡ _i)* +1 +(-a;¡x¡ - • • • - a in x„) k + b,\. 
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Si ocurre que la conjetura anterior x k coincide con la verdadera solución x, entonces la nue¬ 
va conjetura x k+l puede ser la misma, y la cantidad entre corchetes se elimina. 

Ejemplo 3 (SRS) Para la misma A = [ cada paso de sobrerrelajamiento es 



0 

2 


x*+i 


2(1 - cu) 
0 


cu 

2(1 - cu) 


Xk + cüb. 


Si se divide entre cu, estas dos matrices son S y T en la separación A S T; la iteración 
regresa a Sx k +i = T x k + b. La matriz crucial L — S T es 


' 2 0‘ 

-1 

!2(1-cu) cu 1 


1 — CU \u> 

—cu 2 


O 

N) 

i 

e. 


5&>(1 - cu) 1 - CU + í;CU 


La cu óptima hace lo más pequeño posible al mayor valor característico de L (su radio es¬ 
pectral). Todo el chiste del sobrerrelajamiento es descubrir esta cu óptima. El producto de 
los valores característicos es igual a det L = det 7/det S. 

XjX 2 = detL = (1 - cu) 2 . 


Siempre det S = det D porque L está abajo de la diagonal, y det T = det (1 - cu)D porque 
U está arriba de la diagonal. Su producto es det L = (1 - cu)”. (Esto explica por que nun¬ 
ca se llega tan lejos como a cu = 2. El producto de los valores característicos sena tan gran¬ 
de, y la iteración no convergería.) También se obtiene una pista sobre el comportamiento 
de los valores característicos: En la cu óptima, los dos valores característicos son iguales. 
Ambos deben ser iguales tico -l, de modo que su producto coincide con det L. Este valor 
de cu es fácil de calcular, porque la suma de los valores característicos siempre coincide con 
la suma de los elementos diagonales (la traza de L): 

1 2 

cu óptima X, + X 2 = (cu 6pt ~ D + (*><*« - D - 2 - 2cu ápt + -cu ópt . u o 

Esta ecuación cuadrática proporciona cn ópt = 4(2 - V3) « 1.07. Los dos valores caracte¬ 
rísticos iguales son aproximadamente cu - 1 = 0.07, que es una reducción importante de 
valor de Gauss-Seidel A. = i en cu = 1. En este ejemplo la elección correcta de cu ha du¬ 
plicado nuevamente la razón de convergencia, ya que (i) « 0.07 - Si cu se incrementa aun 
más, los valores característicos se convierten en un par conjugado complejo, ya que ambos 
tienen |X| = cu - 1, que ahora crece con cu. 

El descubrimiento de que tal mejoría podía obtenerse tan fácilmente, casi como por ar¬ 
te de magia, fue el punto de partida para 20 años de intensa actividad en análisis numérico. 
El primer problema fue resuelto en la tesis de Young de 1950: una simple fórmula para la cu 
óptima. El paso clave era relacionar los valores característicos X de L con los valores carac¬ 
terísticos ¡j, de la matriz original de Jacobi D \-L - U). Esta relación se expresa como 

Fórmula para m {X + cu — l) 2 = Leu 2 p 2 . O) 

Lo anterior es válido para una amplia variedad de matrices de diferencias finitas, y si se to 
ma cu = 1 (Gauss-Seidel), se obtiene X 2 = Xp, 2 . En consecuencia, X = 0 y X = p~ como 
en el ejemplo 2, donde ¡x = ±| y X = 0, X = i Todas las matrices en la clase de Young 


•>: 

i 



gonal. ¡La matriz A no tiene un ancho de banda pequeño ! No hay ninguna forma para nu¬ 
merar los N 2 puntos de la malla en un cuadrado, de modo que cada punto permanezca 
próximo a sus cuatro vecinos. Esta es la verdadera dirección de la dimensionalidad, y 
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Si el ordenamiento se realiza renglón por renglón, cada punto debe esperar todo un 
renglón para que el vecino de arriba se aproxime. El ancho de banda de la “matriz de cin¬ 
co puntos” es N: 


—1, 2, —1 en x y y 
da —1, —1,4, —1, —1 


Esta matriz ha recibido más atención, y ha sido atacada en más formas diferentes que cual¬ 
quier otra ecuación lineal Ax = b. La tendencia actual es volver a métodos directos, con 
base en una idea de Golub y Hockney: ciertas matrices especiales se apartarán cuando se 
aborden de la manera idónea. (Esto es comparable a la Transformada de Fourier Rápida.) 
Antes del surgimiento de los métodos iterativos de dirección alternada , donde la separa¬ 
ción dividía a la matriz tridiagonal en la dirección x y en la matriz en la dirección y. Una 
elección reciente es 5 = L 0 U 0 , donde elementos pequeños de las verdaderas Ly Use igua¬ 
lan a cero mientras se factoriza A. Se denomina LU incompleta y puede ser terrible. 

No es posible terminar esta sección sin mencionar el método del gradiente conjugado, 
que parecía muerto aunque repentinamente resultó bastante vivo (los pasos se proporcio¬ 
nan en el problema 33). Es directo, más que iterativo, pero a diferencia de la eliminación, 
puede detenerse en cualquier parte del proceso. Y aunque no merece la pena mencionarlo, 
un concepto completamente nuevo puede surgir y ganar. Sin embargo, parece justo decir 
que fue el cambio de 0.99 a 0.75 lo que revolucionó la solución de Ax = b. 

Conjunto de problemas 7.4 

1. Los valores característicos de la siguiente matriz son 2— V2, 2, y 2 + ~Jl\ 



Encuentre la matriz de Jacobi D *(—L — U) y la matriz de Gauss-Seidel (D + 
L)~ l (—U) y sus valores característicos, así como los números a> ópc y X máx para SRS. 

2. Para la siguiente matriz de n por n, describa la matriz de Jacobi J = D~ x {—L — U): 

2 -1 
-1 

• -1 
-1 2 

Demuestre que el vector jq = (sen jth, sen 2 nh ,..., sen nnh ) es un vector caracterís¬ 
tico de J con valor característico A¡ = eos nh = eos n¡(n + 1). 

3. En el problema 2, demuestre que x k — (sen knh , sen 2knh, . . ., sen nknh) es un vec¬ 
tor característico de A, Multiplique x k por A para encontrar el valor característico co¬ 
rrespondiente ct k . Compruebe que en el caso de 3 por 3 estos valores característicos 
son 2 — -s/ 2 , 2,2 + V 2 . 

Nota Los valores característicos de la matriz de Jacobi J = |(—L — U) — I — \ A 
son X k = 1 — ja*. = eos knh. Ocurren en pares más-menos y A mix es eos ith.) 






Lujd 


ingsgfii 




tro en el elemento diagonal a¡¿. Su radio 
largo del resto del renglón. 


'!<■■■, C„ donde C, tiene ; 


/ , a,jxj 
Í ti 


o bien, 


4. La matriz 

‘3 1 r 

A = 0 4 1 

_2 2 5 

Se denomina dominante diagonalmente porque toda |a ¿1 -| > r¡. Demuestre que cero no 
puede estar en ninguno de los círculos, y concluya que A es no singular. 

5. Escriba la matriz de Jacobi J para la matriz A diagonalmente dominante del problema 
4, y encuentre los tres círculos de Gershgorin para J. Demuestre que todos los radios 
satisfacen r¡ < 1, y que la iteración de Jacobi converge. 

6. La verdadera solución de Ax = b es ligeramente diferente de la solución por elimina¬ 
ción de LUx 0 = b\ A — LU se pierde el cero debido al redondeo. Una estrategia es ha¬ 
cer todo en doble precisión, aunque una manera mejor y más rápida es el refinamiento 
iterativo : Calcula sólo un vector r = b — Ax 0 en doble precisión, resuelva LUy — r, y 
sume la corrección y a x 0 . Problema: Multiplicar x¡ = x 0 + y por LU, escriba el resul¬ 
tado como una separación Sx l = Tx 0 + b, y explique por qué T es extremadamente 
pequeña. Este simple paso lleva casi exactamente a x. 

7. Para una matriz general de 2 por 2 


a b 
c d ’ 


encuentre la matriz de la iteración de Jacobi S~ l T = -D~ 1 (L + U) y sus valores 
característicos ¡jl¡. También encuentre la matriz de Gauss-Seidel -(£> + L)~ l U y sus 
valores característicos X¡, y decida si X máx = ix 2 máx . 

Cambie Ax — b a. x = (1 — A)x + b. ¿Cuáles son S y T para esta separación? ¿Qué ma¬ 
triz S~ X T controla la convergencia de x k+i — (/ — A")x k + b ? 

Si X es un valor característico de A, entonces_es un valor característico de 

B = 1 — A. Los verdaderos valores característicos de B tienen valor absoluto menor 
que 1 si los verdaderos valores característicos de A están entre_y . 


Demuestre por qué la iteración x k +\ 
A= F ? "¿I. 


A)xic + b no converge para 
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12. Si A es singular, entonces deben fracasar todas las separaciones A.-S T. A partir 
de Ax = 0, demuestre que S ~‘Tx = x. Por tanto, esta matriz B-S T tiene X 1 y 

fracasa. 

13. Cambie los 2s a 3s, y encuentre los valores característicos de S^T por ambos méto¬ 
dos: 

< J ) B “]*«„-[“ í ]» +6 <GS) [-1 ?]'**' '[o 

¿l-^lmáx para Gauss-Seidel es igual a lUmáx P 313 Jacobi? 

14 Escriba un código de computadora (MATLAB u otro) para Gauss-Seidel. Puede de- 
“ y r a partir de A, o ..tablee., .1 cielo iterativo ttec— • P*"^" 
elementos a tj . Pruébelo en -1, 2, -1 las matrices A de orden 10, 20, 50, con b 

( 1 , 0 ,..., 0 ). 

15 La matriz de separación 5 para SRS es la misma que para Gauss-Seidel, excepto que 

U 2¡on „.. «vid» «de Escriba u» prog»» P» 

n. Aplíquelo con o> = 1. 1.4, 1.8, 2.2 cuando A es la matriz -1. 2, -1 de orden 10. 

16 Cuando A = A T , el método de Amoldi-Lanczos encuentra qs ortonormales de modo 

TZ; - + arn + Mi*. «o - »>- M«lripli,ue po,,Tcon 

lidad de encontrar una fórmula para a,. La ecuación indica que AQ - QT, donde T 
una matriz __-■ 

17. ¿Cuál es la cota sobre |/.| máx proporcionada por Gershgorin para las maí¬ 

ces (consulte el problema 4)? ¿Cuáles son los tres circuios de Gershgonn que contie¬ 
nen a todos los valores característicos? 


'0.3 

0.3 

0.2' 

[ 2 

-1 

0' 

A = 0.3 

0.2 

0.4 

A = -1 
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-1 

0.2 

0.4 

0.1 
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La cuestión clave para matrices grandes, es que la multiplicación matriz-vector es 
mucho más rápida que la multiplicación matriz-matriz. Una construcción crucial em¬ 
pieza con un vector b y calcula Ab, A 2 b, ... (¡pero nunca A !) Los N pnmeroi"g: 
neran el N-é simo subespacio de Krilov. Se trata de las columnas de la matnz K N de Knlov. 

K N ~[b Ab A 2 b ■■■ A N ~ l b], 

La iteración de Amoldi-Lanczos ortogonaliza las columnas de K N , y la iteración del gra¬ 
diente conjugado resuelve Ax = b cuando A es positiva definida simétrica. 

Iteración de Amoldi Iteración del gradiente conjugado - 

qi = bi Pl| *o = 0, r 0 = b, po = r 0 

para n = 1 a N ~ 1 para n = 1 a N 

v = Aq„ «„ = (rJ_ 1 r.- l )/(pJ_ 1 Ap.-i) longitud del paso x._, a x. 

para j = 1 a n x n = x,-i + a P roxime la solución 

hjn = qt v r n = r„-i - ctnApn-x residuo nuevo b ~ Ax n 

'I = v- h jn qj í¡n = (rjr.)/(rj_ 1 r.- 1 ) mejora en este paso 

hn+l „ = || vil Pn = r n + PnPn-i dirección de la siguiente búsqueda 

_ A Jota: Sólo 1 multiplicación matriz-v ector Aq y Ap. ___ 

yn-i-1 U t ' . . ...——--———-- 


7.4 Métodos iterativos para Ax = b 



tástico. 
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Programación lineal 
y teoría de juegos 


8.1 DESIGUALDADES LINEALES 


El álgebra concierne ecuaciones, y a menudo el análisis concierne desigualdades. La línea 
entre ambos siempre ha parecido clara. Sin embargo, me he percatado que este capítulo es 
un contraejemplo: la programación lineal es sobre desigualdades, aunque constituye una 
parte incuestionable del álgebra lineal. También es extremadamente útil: es más probable 
que las decisiones de negocios impliquen programación lineal que determinantes o valores 
característicos. 

Hay tres formas para abordar las matemáticas subyacentes: intuitivamente a través de 
la geometría, computacionalmente a través del método simplex, o algebraicamente a través 
de la dualidad. Estos enfoques se desarrollan en las secciones 8.1, 8.2, y 8.3. Luego, la sec¬ 
ción 8.4 es sobre problemas (como el matrimonio) donde la solución es un entero. En la 
sección 8.5 se analizan el póquer y otros juegos matriciales. Los estudiantes del MIT en 
Bringing Down the House contaron cartas altas para ganar en blackjack (en Las Vegas se 
siguen reglas fijas, y un verdadero juego matricial implica estrategias al azar). 

En la sección 8.3 se presenta algo nuevo en esta cuarta edición. El método simplex 
ahora se presenta en franca competencia con una forma completamente nueva de hacer los 
cálculos, denominada método del punto interior. La emoción comenzó cuando Karmar- 
kar afirmó que su versión era 50 veces más rápida que el método simplex. (Su algoritmo, 
delineado en la sección 8.2, fue uno de los primeros que fueron patentados: algo que en¬ 
tonces creíamos imposible, y no realmente deseable.) Esa afirmación provocó una oleada 
de investigación sobre métodos que tienden a la solución desde el “interior”, donde todas 
las desigualdades son estrictas: x > 0 se convierte enr> 0. El resultado es ahora una gran 
forma de obtener ayuda del problema dual para resolver el problema primario. 

Una clave para este capítulo es considerar los significados geométricos de las desi¬ 
gualdades lineales. Una desigualdad divide el espacio «-dimensional en un semiespacio 
donde se cumple la desigualdad, y en un subespacio en el que no lo hace. Un ejemplo típi¬ 
co es x + 2y > 4. La frontera entre los dos semiespacios es la recta x + 2y = 4, donde la 
desigualdad es “apretada”. La figura 8.1 se vería casi igual en tres dimensiones. La fronte¬ 
ra se convierte en un plano como x + 2y 4- z = 4, y arriba se encuentra el semiespacio 
x + 2y + z > 4. En n dimensiones, la “dimensión” del plano es n — 1. 
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x 


Figura 8.1 Las ecuaciones proporcionan rectas y planos. Las desigualdades, semiespacios. 


Hay otra restricción fundamental para la programación lineal: se requiere que x y y 
sean nonegativas. Este par de desigualdades x > 0 y y > 0 produce dos subespacios más. 
La figura 8.2 está acotada por los ejes coordenados: x > 0 admite todos los puntos a la de¬ 
recha de x = 0, y y > 0 es el subespacio que está arriba de y = 0. 


Ei conjunto factible y la función de costo 

El paso importante es imponer de una vez las tres desigualdades. Estas se combinan para 
proporcionar la región sombreada de la figura 8.2. El conjunto factible es la intersección 
de los tres subespacios x + 2y > 4, x > 0, y y > 0. Un conjunto factible está constituido 
por las soluciones de una familia de desigualdades lineales como Ax > b (la intersección 
de m subespacios). Cuando también se requiere que toda componente de x sea no negativa 
(la desigualdad vectorial x > 0), se agregan n subespacios más. Mientras más restricciones 
se imponen, más pequeño es el espacio factible. 

Puede ocurrir fácilmente que un conjunto esté acotado o incluso sea vacío. Si el ejem¬ 
plo se cambia al subespacio x + 2y < 4, preservando x > 0 y y > 0, se obtiene el pequeño 
triángulo OAB. Al combinar las dos desigualdades x + 2y > 4 y x + 2y < 4, el conjunto 
se reduce a una recta donde x 4- 2y = 4. Si se añade una restricción contradictoria como x 
+ 2y < —2, el conjunto factible es vacío. 

El álgebra de las desigualdades lineales (o conjuntos factibles) constituye una parte 
de nuestro tema de estudio. Sin embargo, la programación lineal tiene otros ingredientes: 
busca el punto factible que maximiza o minimiza una cierta función de costo como 2x + 
3y. El problema en programación lineal es encontrar el punto que está en el conjunto fac¬ 
tible y minimiza el costo. 

El problema se ilustra con la geometría de la figura 8.2. La familia de costos 2x + 3y 
proporciona una familia de rectas paralelas. El costo mínimo aparece cuando la primera 
recta corta al conjunto factible. Esta intersección ocurre en B, donde x* = 0 y y* = 2; el 
costo mínimo es 2x + 3y* = 6. El vector (0, 2) es factible porque está en el conjunto fac¬ 
tible, y es óptimo porque minimiza la función de costo, y el costo mínimo 6 es el valor del 
programa. Los vectores óptimos se denotan con un asterisco. 




8.1 Desigualdades lineales 


costo^2x + 3y = 6 
2x + 3y = 0 



#6® x 


Figura 8.2 Conjunto factible con lados planos, y los costos 2x + 3y, que se tocan en B. 

El vector óptimo ocurre en un vértice del conjunto factible. Este hecho lo garantiza 
la geometría, ya que las rectas que proporcionan la función de costo (o los planos, cuando 
se llega a más incógnitas) se desplazan de manera continua hasta que cortan al conjunto 
factible. ¡El primer contacto debe ocurrir a lo largo de su frontera! El “método simplex” va 
de un vértice del conjunto factible al siguiente hasta que encuentra el vértice de menor cos¬ 
to. En contraste, los “métodos del punto interior” tienden a esa solución óptima desde el 
interior del conjunto factible. 

Nota Con una función de costo distinta, la intersección podría no ser un solo punto. Si el 
costo fuese x + 2y, toda la arista entre B y A sería óptima. El costo mínimo es x* + 2y*, 
que es igual a 4 para todos estos vectores óptimos. En nuestro conjunto factible, ¡el proble¬ 
ma máximo no tendría solución! El costo podría elevarse arbitrariamente y el costo máxi¬ 
mo sería infinito. 

Todo problema de programación lineal puede ubicarse en cualquiera de las tres cate¬ 
gorías posibles siguientes: 

1. El conjunto factible es vacío. 

2 . La función de costo no está acotada en el conjunto factible. 

3. El costo alcanza su mínimo (o máximo) en el conjunto factible: este es el caso bonda¬ 
doso. 

Los casos vacío y no acotado son bastante raros para un problema genuino en economía o 
ingeniería. Se espera una solución. 

Variables flojas 

Hay una forma simple para cambiar la desigualdad x + 2y > 4 en una ecuación. Simple¬ 
mente se introduce la diferencia como una variable floja w = x + 2y — 4. ¡Esta es nues¬ 
tra ecuación! La restricción anterior x + 2y > 4 se convierte en w > 0, lo cual coincide 
perfectamente con las otras restricciones de la desigualdad x > 0, y > 0. Así, se tienen só¬ 
lo ecuaciones y simples restricciones de no negatividad sobre x, y, w. Las variables w que 
“quitan la flojera” ahora se incluyen en el vector incógnito x: 

Problema original Minimizar ex sujeto a Ax = b y .r > 0. 

El vector renglón c contiene los costos; en nuestro ejemplo, c = [2 3 0]. La condición x 
> 0 pone el problema en la parte no negativa de R”. Estas desigualdades se reducen a las 

soluciones de Ax = b. La eliminación corre peligro, por lo que se requiere una idea com¬ 

pletamente nueva. 
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El problema de la dieta y su dual 

Nuestro ejemplo con costo 2x + 3 y puede plantearse con palabras. Ilustra el “problema de 
la dieta” en programación lineal, con dos fuentes de proteínas, por ejemplo, un bistec y 
mantequilla de cacahuate. Cada libra de mantequilla de cacahuate proporciona una unidad 
de proteínas, y cada bistec proporciona dos unidades. En la dieta se requieren por lo me¬ 
nos dos unidades de proteínas. Por tanto, una dieta que contiene x libras de mantequilla de 
cacahuate y y bisteces está restringida por x + 2y > 4, así como por x > 0 y y > 0. (No 
puede tenerse un bistec o mantequilla de cacahuate negativos.) Este es el conjunto factible, 
y el problema es minimizar el costo. Si una libra de mantequilla de cacahuate cuesta $2 y 
un bistec cuesta $3, entonces el costo de toda la dieta es 2x + 3y. Por fortuna, la dieta óp¬ 
tima consta de dos bisteces: x* = 0 y y* = 2. 

Todo programa lineal, incluyendo éste, tiene un dual. Si el problema original es una 
minimización, su dual es una maximización. El mínimo en el “problema original” dado, 
es igual al máximo en su dual. Esta es la clave de la programación lineal, que se explica¬ 
rá en la sección 8.3. Aquí se permanece con el problema de la dieta y se intenta interpretar 
su dual. 

En lugar del comprador, quien compra suficientes proteínas al costo mínimo, el pro¬ 
blema dual es confrontado por el farmacéutico. Las píldoras de proteínas compiten con los 
bisteces y con la mantequilla de cacahuate. De inmediato se encuentran los dos ingredien¬ 
tes de un programa lineal típico: el farmacéutico maximiza el precio p de las píldoras, aun¬ 
que este precio está sujeto a restricciones lineales. Las proteínas sintéticas no deben costar 
más que las proteínas que hay en la mantequilla de cacahuate ($2 por unidad) o las proteí¬ 
nas que hay en los bisteces ($3 por dos unidades). El precio debe ser no negativo o el far¬ 
macéutico no venderá nada. Debido a que se requieren cuatro unidades de proteínas, la 
ganancia del farmacéutico es de 4 p: 

Problema dual Maximizar 4p, sujeto ap <2, 2p < 3 y p > 0. 

En este ejemplo es más fácil resolver el dual que el original; sólo tiene una incógnita p. La 
restricción 2p < 3 es la estricta que en realidad es activa, y el precio máximo de la proteí¬ 
na sintética es p = $1.50. La ganancia máxima es 4 p = $6, y el comprador termina pagan¬ 
do lo mismo por la proteína natural que por la proteína sintética. Este es el teorema de 
dualidad: el máximo es igual al mínimo. 


Aplicaciones típicas 

La siguiente sección se concentra en la resolución de programas lineales. Este es el mo¬ 
mento para describir dos situaciones prácticas en las que se minimiza o maximiza una jun¬ 
ción de costo lineal sujeta a restricciones lineales. 

1. Pianeación de la producción. Suponga que la General Motors gana $200 por cada 
Chevrolet, $300 por cada Buíck y $500 por cada Cadillac. Estos automóviles dan 20, 17, 
y 14 millas por galón, respectivamente, y el Congreso insiste en que el automóvil prome¬ 
dio debe proporcionar 18. La planta puede ensamblar un Chevrolet en un minuto, un Buick 
en dos minutos, y un Cadillac en 3 minutos. ¿Cuál es la ganancia máxima en 8 horas (480 
minutos)? 

Problema Maximizar la ganancia 200x + 300y + 500z sujeta a 

20x + 17y + 14z > 18(x + y + z), x + 2y + 3z < 480, x, y, z > 0. 



tOlAHi 




bonos chatarra, 9%. Es posible comprar cantidades x, y, z sin exceder un total de $100 000. 


i) no es posible invertir más de $20 000 en bonos chatarra, y 

ii) la calidad media del portafolios no debe ser menor que los bonos municipales, de mo¬ 
do que x > z. 

Problema Maximizar 5x + 6y + 9z sujeto a 

x+y+z< 100000, z< 20000, z < x, x, y, z > 0. 

Las tres desigualdades proporcionan tres variables flojas, con nuevas ecuaciones como 

W — x — z y desigualdades vj > 0. 

BE Conjunto de problemas 8.1 

1. Trace el conjunto factible con restricciones x + 2y > 6, 2x 4- y > 6, x > 0, y > 0. 
¿Qué puntos están en los tres “vértices” de este conjunto? 

2. (Recomendado) Sobre el conjunto factible precedente, ¿cuál es el valor mínimo de la 
función de costo x + y? Trace la recta x + y = constante que toca primero el conjun¬ 
to factible. ¿Qué puntos minimizan las funciones de costo 3x -1- y y x — y? 

3. Demuestre que el conjunto factible restringido por 2x + 5y < 3, — 3x + 8y < —5, 
x > 0 , y > 0, es vacío. 

4. Demuestre que el siguiente problema es factible pero no acotado, de modo que no 
tiene solución óptima: Maximizar x + y, sujeto a x > 0, y > 0, — 3x +2y < — 1, 
x - y <2. 

5. Agregue una simple desigualdad restrictiva a x > 0, y > 0 de modo que el conjunto 
factible contenga sólo un punto. 

6. ¿Qué forma tiene el conjunto factible x> 0, y>0, z>0, x+y+z = i , y cuál es 
el máximo de x + 2y + 3z? 

7. Resuelva el problema del portafolios al final de la sección precedente. 

8. En el conjunto factible para el problema de la General Motors, la no negatividad x, y, 
z > 0 deja un octavo del espacio tridimensional (el octante positivo). ¿Cómo es corta¬ 
do esto por los dos planos de las restricciones, y qué forma tiene el conjunto factible? 
¿Cómo muestran sus vértices que, con sólo estas dos restricciones, sólo hay dos tipos 
de automóviles en la solución óptima? 

9. (Problema de transporte) Suponga que Texas, California, y Alaska producen —cada 
uno— un millón de barriles de petróleo; en Chicago se requieren 800 000 barriles, a 
una distancia de 1000, 2000, y 3000 millas de los tres productores, respectivamente; y 
se necesitan 2 200 000 barriles en Nueva Inglaterra a 1500, 3000, y 3700 millas de dis¬ 
tancia. Si el embarque cuesta una unidad por cada barril-milla, ¿qué programa lineal 
con cinco restricciones de igualdad debe resolverse con la finalidad de minimizar el 
costo por embarque? 
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K 8.2 EL MÉTODO SIMPLEX 

Esta sección aborda la programación lineal con n incógnitas x > 0 y m restricciones Ax > 
b. En la sección previa se tenían dos variables, y una restricción x 4- 2y > 4. No es difícil 
explicar todo el problema, pero no es fácil resolverlo. 

El mejor método es plantear el problema en forma matricial. Se cuenta con A, b, ye: 

1. una matriz A de m por n, 

2. un vector columna b con m componentes, y 

3. un vector renglón c (vector de costo) con n componentes. 

Para ser “factible”, el vector x debe satisfacer x > 0 y Ax > b. El vector óptimo x es el vec¬ 
tor factible de costo mínimo , y el costo es ex = CjXi + • ■ ■ + c n x„. 

Problema mínimo Minimizar el costo ex, sujeto a x > 0 y Ax > b. 

La condición x > 0 restringe a x al cuadrante positivo en el espacio «-dimensional. En 
R 2 es un cuarto del plano; es un octavo de R 3 . Un vector aleatorio tiene una posibilidad en 
2" de ser no negativo. Ax > b produce m semiespacios adicionales, y los vectores factibles 
satisfacen todas las m + n condiciones. En otras palabras, x está en la intersección dem + n 
semiespacios. Este conjunto factible tiene lados planos; puede no estar acotado y ser vacío. 

La función de costo ex aporta al problema una familia de planos paralelos. Un plano 
ex — 0 pasa por el origen. Los planos ex = constante proporcionan todos los costos posi¬ 
bles. A medida que varía el costo, estos planos barren todo el espacio «-dimensional. La x 
óptima (el menor costo) ocurre en el punto en que los planos tocan por vez primera al con¬ 
junto factible. 

Nuestro objetivo es calcular x . Esto puede hacerse (en principio) encontrando todos 
los vértices del conjunto factible, y calculando sus costos. En la práctica esto es imposible. 
Podría haber millones de vértices, por lo que sería imposible calcularlos todos. En vez de 
hacer lo anterior, se aplica el método simplex, que es uno de los conceptos más célebres en 
matemáticas computacionales. Este método fue desarrollado por Dantzig como una forma 
sistemática para resolver programas lineales, y ya sea por suerte o no, se trata de un éxito 
sorprendente. Los pasos del método simplex se resumirán en breve, ya que primero se in¬ 
tentará explicarlos. 

La geometría; movimiento a lo largo de las aristas 

Considero que lo que revela el método es la explicación geométrica. En la fase I simple¬ 
mente se localiza un vértice del conjunto factible. El meollo del método va de vértice a vér¬ 
tice a lo largo de las aristas del conjunto factible. En un vértice típico hay n aristas a 
escoger. Algunas aristas se alejan de la x óptima pero desconocida, y otras llevan gradual¬ 
mente hacia ésta. Dantzig escogió una arista que lleva a un nuevo vértice con un costo me¬ 
nor. No hay posibilidad de volver a nada que sea más costoso. Finalmente se llega a un 
vértice especial, a partir del cual todas las aristas conducen al camino equivocado: se ha 
minimizado el costo. Este vértice es el vector óptimo x, y ahí se detiene el método. 

El siguiente problema es transformar los conceptos de vértice y arista en álgebra li¬ 
neal. Una arista es el punto de encuentro de n planos distintos. Cada plano está dado 
por una ecuación —justo como tres planos (muro frontal, muro lateral, y piso) producen un 
vértice en tres dimensiones. Cada vértice del piano factible proviene de transformar n de 
las n + m desigualdades Ax > b y x > 0 en ecuaciones, y encontrar la intersección de es¬ 
tos n planos. 
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Una posibilidad es escoger las n ecuaciones x 1 - 0, . . ., x n = 0, y terminar en el ori¬ 
gen. Así como todas las demás posibilidades, este punto de intersección sólo es un vértice 
genuino si también satisface las demás m restricciones de desigualdad. En caso contrario, 
ni siquiera está en el conjunto factible, por lo que es un engaño total. Nuestro ejemplo con 
n = 2 variables y m = 2 restricciones tiene seis intersecciones, que se ilustran en la figura 
8.3. Tres de ellas en realidad son los vértices P, Q, R del conjunto factible. Se trata de los vec¬ 
tores (0, 6), (2, 2) y (6, 0). Uno de ellos debe ser el vector óptimo (a menos que el costo mí¬ 
nimo sea — oo). Los otros tres, incluyendo el origen, son falsos. 



Figura 8.3 Los vértices P, Q, R y las aristas del conjunto factible. 

En general, hay (n + ni)\/ rc!m! intersecciones posibles. Esto incluye el número de for¬ 
mas para elegir n ecuaciones planas de n + m. El tamaño de este coeficiente binomial ha¬ 
ce imposible el cálculo de todos los vértices para my n grandes. La tarea de la Fase I es 
encontrar un vértice genuino o establecer que el conjunto factible es vacío. Continuamos 
con la hipótesis de que se ha encontrado un vértice. 

Suponga que se retira uno de los n planos de intersección. Los puntos que satisfacen 
las n — 1 ecuaciones restantes constituyen una arista que sale del vértice. Este vértice 
es la intersección de los n — 1 planos. Para permanecer en el conjunto factible, a lo largo 
de cada arista sólo se permite una dirección. Pero se tiene una elección de n aristas, y la Fa¬ 
se II debe hacer esta elección. 

Para describir esta fase, Ax > b vuelve a escribirse en una forma completamente para¬ 
lela a las n restricciones simples x¡ > 0. Este es el papel de las variables flojas w = Ax — 
b. Las restricciones Ax > b se traducen a uq > 0,. . . , w m > 0, con una variable floja pa¬ 
ra cada renglón de A. La ecuación w = Ax — b, o Ax — w — b, pasa a la forma matricial: 

Las variables flojas proporcionan m ecuaciones [A —/ ] * — b. 

El conjunto factible está regido por estas m ecuaciones y las n + m desigualdades simples 
x > 0, w > 0. Ahora se cuenta con restricciones de igualdad y nonegatividad. 

El método simplex no establece ninguna diferencia entre x y w, de modo que se sim¬ 
plifica: 

x se vuelve a í 01 Se vue * ve a 
w nombrar como x L c J nombrar como c. 


se vuelve a 
nombrar como A 
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Las restricciones de igualdad son ahora Ax = b. Las n + m desigualdades se vuelven 
justo x > 0. El único rastro que queda de la variable floja w se encuentra en el hecho de 
que la nueva matriz A es de m por n + m, y la nueva x tiene n + m componentes. Se pre¬ 
serva mucho de la notación original, dejando sin cambio amyn como recordatorio de lo 
que ha ocurrido. El problema ha cambiado a: Minimizar ex, sujeto ax >0y Ax = b. 

Ejemplo 1 El problema en la figura 8.3 tiene las restricciones x + 2y > 6 , 2x + y > 6 , y costo * + y. 
El nuevo sistema tiene cuatro incógnitas (x, y, y dos variables flojas): 

4 * f 1 2-1 °1 b =\ 6 ,1 c=fl 1 0 01 . 


Ei algoritmo simplex 

Con restricciones de igualdad, el método simplex puede comenzar. Un vértice es ahora un 
punto donde n componentes del nuevo vector x (los x y w anteriores) son cero. Estas n 
componentes de x son las variables libres en Ax = b. Las m componentes restantes son las 
variables básicas o variables pivote. Al igualar a cero las n variables libres, las m ecuacio¬ 
nes Ax = b determinan las m variables básicas. Esta “solución básica” x es un vértice ge¬ 
nuino si sus m componentes distintas de cero son positivas. Así, x pertenece al conjunto 
factible. 

8A Los vértices del conjunto factible son las soluciones factibles básicas de Ax = 
b. Una solución es básica cuando n de sus m + n componentes son cero, y es facti¬ 
ble cuando satisface x > 0. La fase I del método simplex encuentra una solución fac¬ 
tible básica. La fase II se desplaza paso a paso hacia la x óptima. 

El punto vértice P en la figura 8.3 es la intersección de x = 0 con 2x + y - 6 = 0. 

fo" 

Vértice (0,6,6,0) i-j 2 -1 0l 6 [6l 

Básica (dos ceros) Ax = 2 j o-l 6 = 6 = b ' 

Factible (positivos diferentes de cero) L J Q J 

¿A cuál vértice ir a continuación ? Se requiere moverse a lo largo de una arista hacia 
un vértice adyacente. Debido a que los dos vértices son vecinos, m - 1 variables básicas 
permanecen siendo básicas. Sólo uno de los 6 s se vuelve libre (cero). Al mismo tiempo, 
una variable se mueve desde cero para convertirse en básica. Las otras m - 1 compo¬ 
nentes básicas (en este caso, los otros 6 ) cambian pero siguen siendo positivas. La elec¬ 
ción de arista (consulte el ejemplo 2 a continuación) decide qué variable sale de la base y 
cuál entra. Las variables básicas se calculan al resolver Ax = b. Las componentes libres 
de x se igualan a cero. 

Ejemplo 2 Una variable que entra y una variable que sale producen un desplazamiento hacia un nue¬ 


vo vértice. 


Minimizar 7x 3 — x 4 — 3 x 5 sujeto a 


+ x 3 + 6 x 4 + 2 x 5 — 8 
x 2 + x 3 + 3xs = 9. 


Se empieza desde el vértice en que x t = 8 y x 2 = 9 son las variables básicas. En ese vér¬ 
tice, x 3 = x 4 = x 5 = 0. Esto es factible, aunque el costo puede no ser el mínimo. Sería im¬ 
prudente hacer positivo a x 3 , ya que su coeficiente de costo es +7 y se está tratando de 
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minimizar el costo. Se escoge x 5 porque tiene el coeficiente de costo más negativo: -3 .La 
variable de entrada es x s 

Con x 5 que entra a la base, deben salir x t o x 2 . En la primera ecuación, x 5 se incremen¬ 
ta y x t se disminuye mientras se mantiene x¡ + 2x 5 = 8 . Luego, x x se lleva hasta cero cuan¬ 
do x 5 llega a 4. En la segunda ecuación se mantiene x 2 + 3x 5 — 9. Aquí x 5 sólo puede crecer 
hasta 3. Ir más allá haría negativo a x 2 , de modo que la variable de salida es x-,. El nuevo 
vértice tiene x = (2, 0, 0, 0, 3). El costo ha bajado a —9. 

Forma rápida En Ax = b, los miembros derechos divididos entre los coeficientes de la va¬ 
riable de entrada son | y |. La razón más pequeña, | indica cuál es la variable que llega 
primero a cero, por lo que debe salir. Sólo se consideran razones positivas, porque si el coe¬ 
ficiente dex 5 fuese —3, entonces incrementar x 5 en realidad haría crecer ax 2 . (Enx 5 = 10, 
la segunda ecuación daría x 2 = 39.) La razón | indica que la segunda variable sale. Tam¬ 
bién proporciona x 5 = 3. 

Si todos los coeficientes de x 5 hubieran sido negativos, se tendría un caso no acotado: 
es posible hacer arbitrariamente grande a x 5 , y disminuir el costo hacia — 00 . 

El paso actual termina en el nuevo vértice x = (2, 0, 0, 0, 3). El paso siguiente es fá¬ 
cil sólo si las variables básicas x x y x 5 se mantienen por sí mismas (como originalmente fue 
el caso con x x y x 2 ). En consecuencia, se “pivotea” sustituyendo x 5 = |(9 — x 2 — x 3 ) en la 
función de costo y en la primera ecuación. El nuevo problema, empezando desde el nuevo 
vértice, es: 

Minimizar el costo 7x 3 - x 4 - (9 - x 2 - x 3 ) = x 2 + 8 x 3 - x 4 - 9 
con restricciones X{ - l x2 + i x3 + 6 x 4 =2 

jX 2 3” jX 3 4- X 5 3. 

El paso siguiente es fácil ahora. El único coeficiente negativo — 1 en el costo hace que la 
variable de entrada sea x 4 . Las razones de | y §, los miembros derechos divididos entre 
la columna de x 4 , hace que x x sea la variable de salida. El nuevo vértice es x* = (0, 0, 0, 

3). El nuevo costo —9j es el mínimo. 

En un problema grande, una variable de salida puede volver a entrar a la base después. 
Pero el costo sigue bajando —excepto en un caso degenerado— de modo que las m varia¬ 
bles básicas no pueden ser las mismas de antes. ¡Ningún vértice se visita dos veces! El mé¬ 
todo simplex debe terminar en el vértice óptimo (o en —00 si ocurre que el costo no está 
acotado). Lo extraordinario es la rapidez con que se encuentre x*. 

Resumen Los coeficientes de costo 7, —1, —3 en el primer vértice y 1, 8 , — 1 en el se¬ 
gundo vértice decidieron las variables de entrada. (Estos números van en r, el vector cru¬ 
cial que se define a continuación. El método se detiene cuando todos son positivos). Las 
razones decidieron las variables de salida. 

Observación sobre la degeneración Un vértice es degenerado si más de las n componen¬ 
tes de costumbre de x son cero. Por el vértice pasan más de n planos, de modo que ocurre 
que una variable básica se hace cero. Las razones que determinan la variable de salida in¬ 
cluyen ceros, y la base podría cambiar sin realmente moverse del vértice. Teóricamente, es 
posible permanecer en un vértice y dar vueltas por siempre en la elección de la base. 

Por fortuna, esta situación no ocurre. Es tan rara que los códigos comerciales la igno¬ 
ran. Lamentablemente, los casos degenerados son bastante comunes en aplicaciones: si el 
costo se imprime después de cada paso simplex, se observa que se repite varias veces an¬ 
tes de que el método simplex encuentre un buen vértice. Luego, el costo decrece otra vez. 
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La tabla (tableáis) 

Cada paso simplex implica decisiones seguidas por operaciones en los renglones —es ne¬ 
cesario escoger a las variables de entrada y de salida, y es necesario hacer que vayan y vuel¬ 
van. Una forma de organizar el paso es escribir A, b, c en una matriz grande, o tabla: 

La tabla es de m + 1 por m + n + 1 T = 

Al inicio, las variables básicas pueden mezclarse con las variables libres. Volviendo a nume¬ 
rar en caso de ser necesario, suponga que x u ..., x m son las variables básicas (distintas de 
cero) en el vértice actual. Las m primeras columnas de A forman una matriz cuadrada B (la 
matriz base para ese vértice). Las n últimas columnas proporcionan una matriz N de m por 
n. El vector de costo se separa en [c B c N \, y la incógnita x lo hace en (x B , x N ). 

En el vértice, las variables libres son x N = 0. Ahí, Ax = b se convierte en Bx b = b: 



Tabla en el vértice 


B 

N ; 

b 

c B 

CN ■ 

"0 


x N = 0 x B = B~'b costo =c b B x b. 


Las variables básicas quedan solas cuando la eliminación multiplica por B 1 : 

I iB-'NIB-'b 

Tabla reducida T - .:.p- • . 


I 

B~ X N 

B~ x b 

c B 

C/y 

0 


Para alcanzar Informa escalonada totalmente reducida R - rref(7), c B multiplicado por 
el renglón en bloque superior se resta del renglón inferior: 


I 

B~ X N 

B~ x b 

0 

c N — c b B~ x N 

—c B B~ x b 


Totalmente reducida R = 


A continuación se revisará el significado de cada elemento de esta tabla, y se llama la aten¬ 
ción hacia el ejemplo 3 (a continuación, con números). He aquí el álgebra: 

Restricciones x B + B~ x Nx n = B~ l b Vértice x B = B~ l b, x N = 0. (1) 


El costo c B x B + c N x N se ha convertido en 

Costo ex =(c N -c B B~ l N)x n + c B B~ l b Costo en este vértice = c B B~ x b. (2) 


Toda cantidad importante aparece en la tabla completamente reducida R. Es posible deci¬ 
dir si el vértice es óptimo al observar a r = c N - c b B~ x N en medio del renglón inferior. Si 
cualquier elemento en r es negativo, sigue siendo posible reducir el costo. Es posible 
hacer negativo a rx N , al principio de la ecuación (2), incrementando una componente de x N . 
Este es el paso siguiente. Pero si r > 0, entonces se ha encontrado el mejor vértice. Esta es 
la prueba de detención, o condición de optimahdad: 

8B El vértice es óptimo cuando r — cpi — c b B l N >0. Su costo es c b B b. 
Las componentes negativas de r corresponden a aristas en las cuales el costo dismi- 
nuye. La variable x¡ corresponde ala componente más negativa de r. 

Las componentes negativas de r son los costos reducidos: el costo en c N por usar una 
variable menos lo que ahorra. El cálculo de r se denomina poner precio a las variables. Si 
el costo directo (en c N ) es menor que el ahorro (de reducir las variables básicas), entonces 
r¡ < 0, y pagará por incrementar esa variable básica. 
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Suponga que el costo reducido más negativo es r¡. Entonces, la ¿-ésima componente de x N 
es la variable de entrada, que crece desde cero hasta un valor positivo a en el vértice si¬ 
guiente (el final de la arista). 

A medida que se incrementa x¡ , otras componentes de x pueden decrecer (para mante¬ 
ner Ax = b). La primera x k que llega a cero se convierte en la variable de salida: cambia de 
básica a libre. El siguiente vértice se alcanza cuando una componente de x B cae a cero. 

El nuevo vértice es factible porque sigue teniéndose x > 0. Es básico porque de nuevo 
se tienen n componentes cero. La ¿-ésima componente de x N pasó de cero a a. La ¿-ésima 
componente de x B cayó a cero (las otras componentes de x B siguen siendo positivas). La x k 
de salida que cae a cero es la que proporciona la razón mínima en la ecuación (3): 


8C Suponga que x ¿ es la variable de entrada y que u es la columna i de N: 


En el nuevo vértice x¡ = a = razón más pequeña 


(B-'b), 


(fí-'£>)* 


(B-'u)j ( B~'u) k 


Este mínimo sólo se toma sobre componentes positivas de B l u. La ¿-ésima colum¬ 
na de B sale de la base (x k se vuelve cero) y entra la nueva columna u. 


B~ x u es la columna de B~ l N en la tabla reducida R, arriba del elemento más negativo en 
el renglón inferior r. Si B~ x u < 0, el siguiente vértice está infinitamente lejos y el costo mí¬ 
nimo es — oo (esto no ocurre aquí). Nuestro ejemplo va del vértice P a Q, y de nuevo em¬ 
pieza en Q. 


Ejemplo 3 La función de costo original x + y y las restricciones Ax = b — (6, 6) proporcionan 



[1 

2 

-1 

0 : 

6 

2 

1 

0 

-1 ¡ 

6 

.1 

1 

0 

0 i 

0 


En el vértice P en la figura 8.3, x = 0 corta a 2x + y — 6. Para estar organizados, se inter¬ 
cambian las columnas 1 y 3 con la finalidad de escribir las variables básicas antes que las 
variables Ubres: 



r -i 

2 i 

1 

0 ! 

6 

Tabla en P 

o 

II 

í*i 

1 i 

2 

-1 i 

6 


L o 

1 i 

1 

0 i 

0 


Luego, la eliminación multiplica el primer renglón por — 1, para obtener un pivote unita¬ 
rio, y usa el segundo renglón para producir ceros en la segunda columna: 


r i 

o i 

3 

-2 i 

6 

Totalmente reducida en P R = 0 

1 j 

2 

-1 i 

6 

. Ó 

o ! 

-1 

i : 

-6 


Primero observe a r = [—11] en el renglón inferior. Tiene un elemento negativo en la co¬ 


lumna 3, de modo que la tercera variable entra a la base. El vértice actual P y su costo +6 
no son óptimos. La columna arriba de ese elemento negativo es B~ x u = (3, 2); sus razo¬ 
nes con la última columna son | y |. Debido a que la primera razón es menor, la primera 
incógnita w (y la primera columna de la tabla) es obligada a abandonar la base. En la figu- 
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La nueva tabla intercambia las columnas 1 y 3, y al pivotear por eliminación se ob¬ 
tiene 

3 0:1-2; ól f 1 0 

2 1 j 0 -1 i 6 —»■ 0 1 

-1 0 : 0 1 1 -6 00 

En esa nueva tabla en Q, r = [ | 5 ] es positivo. Se ha pasado la prueba de deten¬ 

ción. El vértice x = y = 2 y su costo +4 son óptimos. 



Organización de un paso simplex 

A continuación, la geometría del método simplex se representa en álgebra: Los “vértices” 
son “soluciones factibles básicas”. El vector r y la tazón a son decisivos. Su cálculo cons¬ 
tituye el corazón del método simplex, y puede organizarse de tres formas distintas: 

1. En una tabla, como arriba. 

2. Actualizando B ~ 1 cuando la columna u tomada de N sustituye a la columna k de B. 

3. Calculando B = LU, y actualizando estos factores LU en vez de hacerlo con B l . 

Esta lista constituye una breve historia del método simplex. En algunas formas, la eta¬ 
pa más fascinante es la primera —la tabla — que dominó el tema por muchos años. Para la 
mayoría de nosotros, trajo un aura de misterio a la programación lineal, principalmente 
porque se las arregló para evitar casi por completo la notación matricial (¡mediante el dis¬ 
positivo habilidoso de escribir por completo todas las matrices!) Para efectos computa- 
cionales (excepto para pequeños problemas en libros de texto), la época de la tabla ya 
terminó. 

Para ver por qué, recuerde que después de que el coeficiente más negativo en r indica 
cuál columna u entra a la base, no se utilizará ninguna de las otras columnas arriba de r. 
Fue una pérdida de tiempo calcularlas. En un problema más grande, cientos de columnas 
se calculan una y otra vez, justo para esperar su tumo de entrar a la base. Esto permite que 
la teoría haga por completo las eliminaciones y alcanzar R. Sin embargo, en la práctica no 
es posible justificar esto. 

Es más rápido, y al final más simple, ver cuáles cálculos son realmente necesarios. Ca¬ 
da paso simplex intercambia una columna de N por una columna de B. Estas columnas son 
decididas por r ya. Este paso comienza con la matriz base actual B y la solución actual 
x B = B~ x b. 

Un paso del método simplex . 

1 . Se calculan el vector renglón X = c b B~ 1 y los costos reducidos, r = c N - XN. 

2. Si r ■> 0, detener el procedimiento: la solución actual es óptima. En caso contra¬ 
rio, si r¡ es la componente más negativa, para entrar a la base se escoge u = co¬ 
lumna i de. ¿V. 

3. Se calculan las razones de B~ l b a B~hi, admitiendo sólo componentes positivas 
de B~ 1 u.'( Si B~ l u < 0, entonces el costo mínimo es — 00 ). Cuando la razón más 
pequeña ocurre en la componente k,. de la base sale la k-é sima columna de la B 
actual. 

4 . Se actualiza B, B~ l , o LU, así como la solución x B = B~ l b. Se vuelve al paso 1. 
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Algunas veces, lo anterior se denomina método simplex revisado para distinguirlo de 
las operaciones en la tabla. En realidad es el método simplex en sí, reducido. 

Este análisis termina una vez que se ha decidido cómo calcular los pasos 1, 3, y 4: 

X — c e B~~\ v = B~ x u, y x B = B~ l b. (4) 

La forma más conocida es trabajar directamente con B~\ calculándola explícitamente en 
el primer vértice. En vértices subsecuentes, el paso de pivoteo es sencillo. Cuando la co¬ 
lumna k de la matriz identidad se sustituye por u, la columna k de B~ l se sustituye por v = 
B~ l u. Para reconvertir la matriz identidad, la eliminación multiplica la anterior por 



En muchos códigos simplex se utiliza la forma de producto de la inversa, que ahorra 
estas simples matrices E~ 1 en vez de actualizar directamente a B~ l . Cuando es necesario, 
se aplican a b y c B . A intervalos regulares (quizá cada 40 pasos simplex), se vuelve a 
calcular B~ 1 y la E~ 1 se borra. En el problema 9 se comprueba la ecuación (5), al final de 
esta sección. 

En un método más reciente se usan los métodos normales del álgebra lineal numérica, 
considerando a la ecuación (4) como tres ecuaciones que comparten la misma matriz B: 

XB = c B , Bv = u, Bx b = b. (6) 

La factorización de costumbre B = LU (o PB = LU, con intercambios de renglones por ra¬ 
zones de estabilidad) conduce a las tres soluciones. Ly U pueden actualizarse, en vez de 
calcularlas de nuevo. 

Queda una pregunta: ¿ Cuántos pasos simplex es necesario efectuar ? Es imposible 
contestar de antemano. La experiencia indica que el método toca sólo alrededor de 3m/l 
vértices distintos, lo cual significa un conteo de operaciones aproximado de m 2 n. Esto es 
comparable con la eliminación normal para Ax = b, y es la razón del éxito del método sim¬ 
plex. Sin embargo, las matemáticas muestran que la longitud de la ruta no siempre puede 
acotarse por cualquier múltiplo fijo o potencia de m. Los peores conjuntos factibles (Klee 
y Minty inventaron un cubo lobulado) pueden obligar a que el método simplex intente ca¬ 
da vértice, a costo exponencial. 

Fue el método de Khachian lo que demostró que la programación lineal podía resol¬ 
verse en tiempo polinomial.* Su algoritmo permaneció dentro del conjunto factible, y cap¬ 
turó a x en una serie de elipsoides que se contraen. La programación lineal está en la clase 
agradable P, no en la temible clase NP (como el problema del agente de ventas viajero). 
Para problemas NP, se considera (aunque no está demostrado) que todos los algoritmos de- 
terminísticos deben terminar en un tiempo interminablemente exponencial, en el peor de 
los casos. 

Todo este tiempo, el método simplex ha hecho su trabajo —en un tiempo medio del 
que ya se ha demostrado (para variantes del método de costumbre) que es polinomial. Por 

* El número de operaciones está acotado por potencias de m y n, como en la eliminación. Para pro¬ 
gramación entera y factorización en primos, todos los algoritmos conocidos pueden ser exponencial¬ 
mente largos. La célebre conjetura “P ¥= NP” establece que tales problemas no pueden tener 
algoritmos poiinomiales. 
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alguna razón, oculta en la geometría de poliedros de muchas dimensiones, los malos con¬ 
juntos factibles son raros y el método simplex tiene suerte. 

Método de Karmarkar 

Ahora llegamos al evento más sensacional que ha ocurrido en la historia reciente de la pro¬ 
gramación lineal. Karmarkar propuso un método basado en dos conceptos simples, y en sus 
experimentos derrotó al método simplex. Tanto la elección del problema como los detalles 
del código son cruciales, y el debate sigue vigente. Sm embargo, las ideas de Karmarkar 
eran tan naturales y se ajustaban tan perfectamente al marco de referencia del algebra 
neal aplicada, que pueden explicarse en unos cuantos párrafos. _ 

La primera idea es comenzar desde un punto que esté dentro del conjunto factible : se 
supondrá que es x° = (1, 1,..., D- Debido a que el costo es ex, la mejor dirección para re¬ 
ducir el costo es hacia -c. Normalmente, lo anterior nos saca del conjunto factible; mover¬ 
se en esa dirección no preserva Ax = ¿. Si Ax° = b y Ax 1 = í>, entonces Ax = x - * debe 
satisfacer AAx = 0 . El paso Ax debe estar en el espacio nulo de A. En consecuencia, c 
se proyecta sobre el espacio nulo, con la finalidad de encontrar la dirección factible mas pró¬ 
xima a la mejor dirección. Este es un paso natural pero costoso en el método de Karmarkar. 

El paso Ax es un múltiplo de la proyección -Pe. Mientras más grande sea el paso, mas 
se reduce el costo, aunque no es posible salir del conjunto factible. El múltiplo de -Pe se 
escoge de modo que x l esté próximo, aunque un poco adentro , de la frontera en la cual una 

componente de x llega a cero. .,, 

Así se completa la primera idea: la proyección que proporciona e¡\ descenso factible 
más pronunciado. El segundo paso requiere una nueva idea, ya que continuar en la misma 

dirección es inútil. . 

La sugerencia de Karmarkar es transformar x' de vuelta a (1,1,..., 1) en el centro. 
Su cambio de variables no era lineal, pero la transformación más simple es justo un rees¬ 
calamiento por una matriz diagonal D. Luego ya hay espacio para moverse. El reescala¬ 
miento desde x hasta X = D~ x x cambia las restricciones y el costo: 

Ax = b se vuelve ADX = b c T x se vuelve c r DX. 

En consecuencia, la matriz AD toma el sitio de A, y el vector c T D toma el lugar de c .El 
segundo paso proyecta la nueva c sobre el espacio nulo de la nueva A. Todo el trabajo es¬ 
tá en esta proyección, para resolver las ecuaciones normales ponderadas: 

(.AD 2 A T )y = AD 2 c. ( 7 > 

La forma normal para calcular y es por eliminación. El proceso de Gram-Schmidt ortogo- 
naliza las columnas de DA r , lo cual puede resultar costoso (aunque facilita el resto de los 
cálculos). El método favorito para problemas ralos grandes es el método del gradiente con¬ 
jugado, que proporciona la respuesta exacta más lentamente que la eliminación, aunque 
puede aplicarse parcialmente y luego detenerse. A mitad de la eliminación no es posible de- 
tenerse 

Así como otras ideas nuevas en la computación científica, el método de Karmarkar tu¬ 
vo éxito en algunos problemas y en otros no. La idea subyacente fue analizada y mejorada. 
Un éxito primordial lo constituyen métodos de punto interior (que permanecen dentro de 
conjunto factible) más recientes, que se mencionan en la siguiente sección. Y el método 
simplex sigue siendo tremendamente valioso, como todo el tema de la programación lineal, 
que fue descubierta siglos después que Ax — b, aunque comparte las ideas fundamentales 
del álgebra lineal. De estas ideas, la que va más lejos es la de dualidad, que se presenta a 
continuación. 
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Conjunto de problemas 8.2 

1. Minimizar x x + x 2 — x 3 , sujeto a 

2xi — 4 x 2 + x 3 + x 4 =4 

3xi + 5x2 + X 3 + X 5 = 2 . 

¿Cuál de Xj, x 2 , x 3 debe entrar a la base, y cuál de x 4 , x 5 , debe salir? Calcule el nuevo 
par de variables básicas, y encuentre el costo en el nuevo vértice. 

2. Después del paso simplex precedente, prepare y decida el paso siguiente. 

3. En el ejemplo 3, suponga que el costo es 3x + y. Con reagrupamiento, el vector de 
costo es c = (0, 1, 3, 0). Demuestre que r > 0 y, en consecuencia, que el vértice P es 
óptimo. 

4. Suponga que la función de costo en el ejemplo 3 es x — y, de modo que después de un 
reagrupamiento c = (0, —1, 1, 0) en el vértice P. Calcule r y decida qué columna u 
debe ser elemento de la base. Entonces calcule B~ l u y muestre desde su signo que 
nunca llegará a otro vértice. En la figura 8.3 estamos escalando el eje y y x — y llega 
a —oo. 

5. De nuevo en el ejemplo 3, cambie el costo a x + 3y. Compruebe que el método sim¬ 
plex va de P a Q a R, y que el vértice R es óptimo. 

6. La Fase I encuentra una solución factible básica de Ax = b (un vértice). Después de 
cambiar signos para hacer b > 0, considere el problema auxiliar de minimizar w¡ + 
w 2 + ... + w m , sujeto ax > 0, w > 0, Ax -I- w = b. Siempre que Ax = b tiene una 
solución nonegativa, el costo mínimo en este problema es cero, con u>* = 0. 

a) Demuestre que, para este nuevo problema, el vértice x = 0, w = b es tanto bási¬ 
co como factible. En consecuencia, su Fase I ya está establecida, y el método sim¬ 
plex puede proceder para encontrar el par óptimo x*, w". Si w* = 0, entonces x* 
es el vértice requerido en el problema original. 

b) Con A = [1 — 1] y b = [3], escriba el problema auxiliar, el vector de su Fase I 

x = 0, w = b, y su vector óptimo. Encuentre el vértice del conjunto factible 

xi — x 2 = 3, xi > x 2 > 0, y trace una figura de este conjunto. 

7. Si quisiera maximizarse el costo en vez de minimizarlo (con Ax = b y x > 0), ¿cuál 
sería la prueba de detención sobre r, y qué reglas escogerían la columna de N con la 
finalidad de hacerla básica y la columna de B para hacerla libre? 

8. Minimice 2x! + x 2 , sujeto a x t + x 2 > 4, x¡ + 3x 2 > 12, x¡ — x 2 > 0, x > 0. 

9. Compruebe la inversa en la ecuación (5), y demuestre que BE tiene Bv = u en su 
£-ésima columna. Así, BE es la matriz básica correcta para la siguiente detención, 

es su inversa, y E~ x actualiza correctamente la matriz básica. 


10. Suponga que se quiere minimizar ex = x t — x 2 , sujeto a 


2xi — 4 x 2 + x 3 =6 
3xi + 6x 2 + x 4 = 12 


(toda x t , x 2 , x 3 , x 4 > 0). 


Empezando desde x = (0, 0, 6, 12), ¿deben incrementarse x x o x 2 a. partir de su valor 
actual de cero? ¿Cuánto puede incrementarse hasta que la ecuación obliga a cero a x 3 
o x 4 ? En ese punto, ¿cuál es el nuevo x? 
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11. Para la matriz P = / - A T (AA T r l A , demuestre que si * está en el espacio nulo de 
A, entonces Px = x. El espacio nulo permanece sin cambio bajo esta proyección. 

12. a) Minimice el costo c T x = 5x¡ + 4x 2 + 8x 3 sobre el plano x¡ + x 2 + x 3 = 3, pro¬ 

bando los vértices P, Q, R, donde el triángulo está cortado por el requerimiento 

x > 0. , 

b) Proyecte c = (5, 4, 8) sobre el espacio nulo de A = [1 1 1], y encuentre el paso má¬ 
ximo s que mantiene nonegativo ae — sPc. 


EL PROBLEMA DUAL 


La eliminación puede resolver Ax = b, pero los cuatro subespacios fundamentales han de¬ 
mostrado que una comprensión diferente y más profunda es posible. Es exactamente lo 
mismo para la programación lineal. La mecánica del método simplex resuelve un progra¬ 
ma lineal, aunque la dualidad se encuentra en el centro de la teoría subyacente. La intro¬ 
ducción del problema dual es una idea elegante, que al mismo tiempo es fundamental para 
las aplicaciones. Se explicará tanto como entendemos. 

La teoría empieza con el problema original dado: 


Original (P) 


Minimizar ex, sujeto a x > 0 y Ax > b. 



El problema dual comienza a partir de las mismas A, b, y c, e invierte todo. En el proble¬ 
ma original, c está en la función de costo y b está en la restricción. En el problema dual, se 
cambian by c. La incógnita dual y es un vector renglón con m componentes, y el conjun¬ 
to factible tiene yA < c, en vez de Ax > b. _ 

En corto, el dual de un problema mínimo es un problema máximo. Ahora y > 0: 

..... ... ........ ' -Ai-, -'v \ '•¿-"'-Atósi ’j; íbC c. i ■- 

Dual (D) Maximizar yb, sujeto a y > 0 y yA < c. 


El dual de este problema es el problema mínimo original. Hay simetría completa entre los 
problemas dual y original. El método simplex es igualmente válido para una maximiza- 
ción; en todo caso, ambos problemas se resuelven a la vez. 

Es necesario proporcionar una interpretación de todas estas inversiones. Aconsejan 
una competencia entre el minimizador y el maximizador. En el problema de la dieta, el mi- 
nimizador cuenta con n alimentos (mantequilla de cacahuate y bistec, en la sección 8.1). 
Entran en el problema de la dieta en las cantidades (nonegativas) x u ... , x n . Las restric¬ 
ciones representan m vitaminas requeridas, en vez de una restricción anterior de suficien¬ 
tes proteínas. El elemento a y mide la í-ésima vitamina en elj-ésimo alimento, y el j-esimo 
renglón de Ax > b obliga a que en la dieta se incluya por lo menos b¡ de esa vitamina. Si 
Cj es el costo del j-ésimo alimento, entonces c x x\ + • ■ • + c„x„ — ex es el costo de la die¬ 
ta. Este es el costo que debe minimizarse. _ _ 

En el dual, el farmacéutico vende píldoras de vitamina, a precios y¿ > 0. Debido a 
que el alimento j contiene vitaminas en las cantidades a ip el precio del farmacéutico para 
el equivalente de vitaminas no puede exceder el precio c¡ del tendero. Esta es la j-esima res¬ 
tricción en yA < c. Al trabajar dentro de esta restricción sobre los precios de las vitaminas, 
el farmacéutico puede vender la cantidad requerida b¡ de cada vitamina por un ingreso to¬ 
tal de y! b x +■■■ + y m b m = yb a maximizar. 
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Los conjuntos factibles para los problemas original y dual se ven completamente dife¬ 
rentes. El primero es un subconjunto de R", marcado por x > 0 y Ax > b. El segundo es un 
subconjunto de R m /determinado por y > 0 y A T y c. Toda la teoría de la programación li¬ 
neal radica en la relación que hay entre el original y el dual. A continuación se presenta el 
resultado fundamental: 

8D Teorema de dualidad Cuando ambos problemas tienen vectores factibles, 
tienen x y y* óptimos. El costo mínimo ex* es igual al ingreso máximo y*b. 

Si los vectores óptimos no existen, hay dos posibilidades: ya sea que ambos conjuntos fac¬ 
tibles son vacíos o uno es vacío y el otro problema no está acotado (el máximo es +oo o 
el mínimo es — oo). 

El teorema de dualidad establece la competencia entre el tendero y el farmacéutico. El 
resultado siempre es un empate. En la teoría de juegos se encuentra un “teorema minimax” 
semejante. El cliente no tiene ninguna razón económica para preferir las vitaminas a los ali¬ 
mentos, aun cuando el farmacéutico garantice igualar al tendero en cada alimento —e in¬ 
cluso venda más barato los alimentos costosos (como la mantequilla de cacahuate). Se 
demostrará que los alimentos costosos se mantienen fuera de la dieta original, de modo que 
la salida puede ser (y es) un empate. 

Lo anterior puede parecer un punto muerto, aunque espero que el lector no se deje en¬ 
gañar. Los vectores óptimos contienen la información crucial. En el problema original, x* 
indica al comprador qué comprar. En el dual, y* fija los precios naturales (precios imagi¬ 
narios) a los cuales la economía debería marchar. En tanto nuestro modelo lineal refleje la 
verdadera economía, x y y* representan las decisiones esenciales que han de tomarse. 

Se quiere demostrar que ex = y"b. Puede parecer evidente que el farmacéutico 
pueda subir los precios y* de las vitaminas para encontrar al comprador, aunque sólo una 
cuestión es verdaderamente clara: Debido a que cada alimento puede sustituirse por su 
equivalente vitamínico, sin incremento en el costo, todas las dietas alimentarias idóneas de¬ 
ben costar por lo menos tanto como las vitaminas. Esta desigualdad es unilateral: precio del 
farmacéutico < precio del tendero. Se denomina dualidad débil, y es fácil demostrarlo pa¬ 
ra cualquier programa lineal y su dual: 

8E Si x y y son factibles en los problemas original y dual, entonces . yb < ex. 

Demostración Debido a que los vectores son factibles, satisfacen Ax > b y yA < c. De¬ 
bido a que la factibilidad también incluye x > 0 y y > 0, es posible tomar productos inter¬ 
nos sin arruinar estas desigualdades (multiplicar por números negativos debe invertirlos): 

yAx > yb y yAx < ex. (1) 

Debido a que los miembros izquierdos son idénticos, se tiene la dualidad débil yb < ex. m 

Esta desigualdad unilateral prohíbe la posibilidad de que ambos problemas sean no 
acotados. Si yb es arbitrariamente grande, una x factible contradice yb < ex. De manera se¬ 
mejante, si ex puede ir hacia — oo, entonces el dual no puede admitir una y factible. 

Igualmente importante, cualesquiera vectores que alcancen yb = ex deben ser ópti¬ 
mos. En este punto el precio del tendero es igual al del farmacéutico. Una dieta alimenta¬ 
ria óptima y los precios óptimos de las vitaminas se reconocen por el hecho de que el 
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consumidor no tiene nada que elegir: 

8F Si los vectores x y y son factibles y ex = yb, entonces x y y son óptimos. 

Debido a que ningún y puede hacer yb más grande que ex, la y que alcanza este valor 
es óptima. De manera semejante, cualquier x que alcance el costo ex — yb debe ser una x 
óptima. 

A continuación se proporciona un ejemplo con dos alimentos y dos vitaminas. Obser¬ 
ve que A t aparece cuando se escribe el dual, ya que yA < c para vectores renglón signifi¬ 
ca A T y T < c T para columnas. 

Original Minimizar x t + 4x 2 Dual Maximizar 6 y, + ly-i 

sujeto a xi > 0, x 2 > 0 sujeto ay, > 0, y 2 > 0 

2x\ + x 2 > 6 2yi + 5y 2 < 1 

5x, + 3 x 2 >7. yt + 3 x 2 < 4. 

Solución x¡ = 3 y x 2 = 0 son factibles, con costo x 1 + 4x 2 = 3. En el dual, y t = 5 y 
y 2 — (} proporcionan el mismo valor 6yi + 7y 2 = 3. Estos vectores deben ser óptimos. 

Por favor, observe la situación detenidamente para ver lo que ocurre realmente en el 
momento en que yb = ex. Algunas de las restricciones de desigualdad son estrictas, lo cual 
significa que se cumple la igualdad. Otras restricciones son flojas, y la regla clave tiene sen¬ 
tido económico: 

i) La dieta tiene x'f = 0 cuando el precio de los alimentos y se fija por arriba de su 
equivalente vitamínico. 

ii) El precio es y* = 0 cuando se tiene una sobreoferta de vitamina i en la dieta x . 

En el ejemplo, x-, = 0 porque el segundo alimento es demasiado costoso. Su precio exce¬ 
de el precio del farmacéutico, ya que y, + 3y 2 < 4 es una desigualdad estricta { + 0 < 4. 
De manera semejante, la dieta requería siete unidades de la segunda vitamina, aunque en 
realidad proporcionó 5xi + 3x 2 = 15. Así, se encontró y 2 = 0, y esta vitamina es un pro¬ 
ducto libre. Puede verse cómo se ha completado la dualidad. 

Estas condiciones de optimalidad pueden entenderse fácilmente en términos matricia- 
les. A partir de la ecuación (1) se quiere y Ax — y b en el óptimo. La factibilidad requie¬ 
re Ax* > b, y se buscan cualesquiera componentes en las que fracase la igualdad. Esto 
corresponde a una vitamina que esté sobreofrecida, de modo que su precio es y* = 0 . 

Al mismo tiempo, se tiene y*A < c. Todas las restricciones estrictas (alimentos costo¬ 
sos) corresponden a x* = 0 (omisión en la dieta). Esta es la clave para y Ax = ex , que 
se requiere. Estas son las condiciones flojas complementarias de la programación lineal, 
y las condiciones de Kuhn-Tucker de programación no lineal: 

8G Los vectores óptimos x* y y* satisfacen la flojedad complementaria: 

si (Ax*)¡ > b¡ entonces y* = 0 si (y* A), < c¡ entonces x* = 0. (2) 

A continuación se repite la demostración. Cualesquiera vectores factibles x y y satisfacen 
la dualidad débil: 

(3) 


yb < y(Ax) = (yA)x < ex. 
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Se requiere la igualdad, y sólo hay una forma en que y*b puede ser igual a y*(Ax*). Cada 
vez que b¡ < (Ax*)¡, el factor y* que multiplica a estas componentes debe ser cero. 

De manera semejante, la factibilidad proporciona yAx < ex. La igualdad se obtiene só¬ 
lo cuando se cumple la segunda condición de flojera. Si hay un sobreprecio (y*A)j < c-, de¬ 
be cancelarse a través de la multiplicación porx* = 0. Así, se queda con y'b = ex* en la 
ecuación (3). Esta igualdad garantiza la optimalidad de x* y y*. 

Demostración de la dualidad 

La desigualdad unilateral yb < ex fue fácil de demostrar; proporcionó una prueba rápida 
para vectores óptimos (la convierten en igualdad); y ahora ha proporcionado las condicio¬ 
nes de flojera en la ecuación (2). Lo único que no ha hecho es mostrar que y ’b = ex* real¬ 
mente es posible. El teorema de dualidad no está completo sino hasta que se obtienen estos 
vectores óptimos. 

Para obtener y*, se regresa al método simplex, que ya ha calculado x. El problema 
consiste en mostrar que el método se detuvo en el momento indicado para el problema dual 
(aun cuando se construyó para resolver el problema original). Recuerde que las m desigual¬ 
dades Ax > b se cambiaron a ecuaciones, mediante la introducción de las variables flojas 
w — Ax — b: 

Factibilidad original [A—/]*=¿> y * > 0. (4) 

Cada paso simplex escogió m columnas de la matriz larga [A — /] para hacerlas básicas, y 
las desplazó (teóricamente) hacia el frente. Así se obtuvo [B Ai]. El mismo desplazamien¬ 
to reordenó el largo vector de costo [c 0] en [c B c w ]. La condición de detención, que lle¬ 
vó a término al método simplex, era r — Cs — c g B~ l N > 0. 

Esta condición r > 0 se alcanzó finalmente , ya que el número de vértices es finito. En 
ese momento, el costo era lo más bajo posible: 

fo-l l~~\ 

Costo mínimo ex* = [c B Dv] Q =c s B~ l b. (5) 

Si en el dual puede escogerse y* = c g B~ l , ciertamente se tiene y*b = ex*. El míni¬ 
mo y el máximo son iguales. Debe demostrarse que esta y* satisface las restricciones dua- 
les yA < c y y > 0: 

Factibilidad dual y [A — /] < [c 0], (6) 

Cuando el método simplex vuelve a mezclar la gran matriz y el vector para poner primero 
las variables básicas, esto reagrupa las restricciones en la ecuación (6) como 

y [B a] < [c B Cjv]. (7) 

Para y* = c b B~\ la primera mitad es una igualdad y la segunda es c b B~ 1 N <c n . ¡Esta 
es la condición de detención r > 0 que se sabe debe cumplirse! En consecuencia, la y* es 
factible, y se ha demostrado el teorema de dualidad. Al localizar la matriz crítica B de m 
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Precios imaginarios 

En cálculo, todo mundo conoce la condición para un máximo o un mínimo: las primeras 
derivadas ’son cero. Sin embargo, este hecho es transformado completamente por las res¬ 
tricciones. El ejemplo más sencillo es la recta y = x. Su derivada nunca es cero, el cálculo 
parece inútil, y ciertamente la mayor y ocurre al final del intervalo. ¡Esta es exactamente la 
situación en programación lineal! Hay más variables, y un intervalo se sustituye por un 
conjunto factible, aunque el máximo sigue encontrándose en un vértice del conjunto facti¬ 
ble (con sólo m componentes diferentes de cero). 

El problema en programación lineal es localizar ese vértice. Para este efecto, el cálcu¬ 
lo no es completamente inútil. Lejos de ello, porque los “multiplicadores de Lagrange 
harán cero las derivadas en el máximo y en el mínimo. Las variables duales y son exacta¬ 
mente los multiplicadores de Lagrange. Y responden la pregunta clave: ¿Cómo cambia el 
costo mínimo ex* = y*b, si se cambian b o c? 

Esta es una pregunta en análisis de sensibilidad. Permite obtener información adicio¬ 
nal del problema dual. Para un economista o un ejecutivo, estas preguntas sobre costo mar¬ 
ginal son las más importantes. 

Si se permiten grandes cambios en b o en c, la situación se comporta de manera bastan- 
te irregular. Cuando aumenta el precio de los huevos, hay un punto en el que éstos desapa¬ 
recen de la dieta. La variable x huevo salta de básica a libre. Para seguirla correctamente, es 
necesario introducir programación “paramétrica”. Pero si los cambios son pequeños, . el ver- 
tice que era óptimo permanece siendo óptimo. La elección de las variables básicas no 
cambia; By N siguen siendo las mismas. Geométricamente, el conjunto factible se ha des¬ 
plazado un poco (al cambiar b), y los planos que lo cortan se han inclinado (al cambiar c). 
Cuando estos cambios son pequeños, el contacto ocurre en el mismo vértice (que se ha mo¬ 
vido ligeramente). 

Al final del método simplex, cuando se conocen las variables básicas idóneas, las m 
columnas correspondientes de A constituyen la matriz base B. En ese vértice, un desplaza¬ 
miento de tamaño A b modifica el costo mínimo por y’A*. La solución dual y propor¬ 
ciona la razón de cambio del costo mínimo (su derivada) respecto a cambios en b. Las 
componentes de y* son los precios imaginarios. Si el requerimiento para una vitamina su¬ 
be por A y el precio del farmacéutico es y*, entonces el costo de la dieta (del farmacéutico 
o del tendero) sube por y*A. En el caso en que y* es cero, esa vitamina es un producto li¬ 
bre y el pequeño cambio no tiene ningún efecto. La dieta ya contenía más que b x . 

Ahora se plantea una pregunta diferente. Suponga que se insiste en que la dieta con¬ 
tenga una pequeña cantidad digerible de huevo. La condición x huevo > 0 cambia a x huevo > 
8. ¿Cómo modifica esto al costo? 

Si en la dieta x* hubiera huevo, no habría ningún cambio. Pero si x* uevo = 0, habrá un 
costo extra por agregar la cantidad S. El incremento no será en todo el precio Chuevo^, ya 
que es posible reducirlo de los otros alimentos. El costo reducido de los huevos es su pro¬ 
pio precio, menos el precio que se paga por el equivalente en alimentos más baratos. Para 
calcularlo, se regresa a la ecuación (2) de la sección 8.2: 

costo = ( Cr/ - c b B~ 1 N)x n + c B B~ x b = rx N + c B B~ l b. 

Si el huevo es la primera variable libre, entonces el incremento de la primera componente 
de x N a S aumenta el costo por r,S. El verdadero costo del huevo es r t . Este es el cambio 
en el costo de la dieta cuando la cota inferior cero (restricción de no negatividad) se mue¬ 
ve hacia arriba. Se sabe que r > 0, y la economía indica lo mismo: el costo reducido de los 
huevos no puede ser negativo, o habrían entrado a la dieta. 


FACULTAD P.B-. 
U N * V 


CONCEPCION DEL URUGUAY 
" ■ ' r -‘ o c ; 8 : 3 a ¡_ 


Métodos de puntos interioras'- r ..., V: c " : ;; i- ■ 

r ... _ • ~¡GU DEL URUGUAY 

- Hcr. ARGENTINA 

El método simplex se mueve a lo largo de los vértices del conjunto factible, para llegar fi¬ 
nalmente al vértice óptimo x*. Los métodos de puntos interiores empiezan dentro del con¬ 
junto factible (donde todas las restricciones son rí&sigualdades). Estos métodos esperan 
moverse directamente aje* (y también encontrar y*). Una vez que están muy próximos a la 
respuesta, se detienen. 

Una forma de permanecer dentro es colocando una barrera en la frontera. Agregar un 
costo extra en la forma de un logaritmo que se infla cuando cualquier variable x o cualquier 
variable floja w = Ax — b toca cero. El número 8 es un pequeño parámetro a escoger: 


( n m \ 

^T^lnjty + ^T^lnic,- J. (8) 

Este costo es no lineal (aunque la programación lineal de hecho ya no es lineal, a partir de 
las desigualdades). La notación es más simple si el vector largo (x, w) vuelve a identificar¬ 
se como x y [A —/] se vuelve a identificar como A. Ahora, las restricciones originales son 
x > 0 y Ax = b. La suma de ln x¡ en la barrera pasa ahora a m + n. 

Las restricciones duales son yA < c. (Cuando se tiene Ax = b en el original no se re¬ 
quiere y > 0). La variable floja es s — c — yA, con s > 0. ¿Cuáles son las condiciones de 
Kuhn-Tucker para que x y y sean las x* y y* óptimas? Junto con las restricciones se requie¬ 
re dualidad: ex* = y*b. 

Incluyendo la barrera se obtiene un problema aproximado P{9). Para sus condiciones 
de Kuhn-Tucker de optimalidad, la derivada de ln x¡ proporciona l/x¡. Si a partir de estos 
números positivos x¡ se crea una matriz diagonal Y, y se usa e = [1 ... 1] para el renglón 
vector de n + m unos, entonces la optimalidad en P (8) es como sigue: 

Original (vectores columna) Ax = b con x > 0 (9a) 

Dual (vectores renglón) yA + 6eX~' = c (9b) 

Cuando 6 —> 0, es de esperar que las x y y óptimas tiendan a x* y y* para el problema ori¬ 
ginal sin barrera, y que 6eX~ 1 permanezca no negativo. El plan es resolver las ecuaciones 
(9a y 9b) con barreras cada vez más pequeñas, dadas por el tamaño de 6. 

En realidad, estas ecuaciones no lineales se resuelven aproximadamente con el méto¬ 
do de Newton (lo cual significa que son linealizadas). El término no lineal es s = 6eX 
Para evitar l/x¡, lo anterior se vuelve a escribir como sX = Be. Al crear la matriz diagonal 
5 a partir de s, ésta es eSX = Be. Si e, y, c, y s se cambian a vectores columna, y se traspo¬ 
ne, ahora la optimalidad consta de tres partes: 


Original 

Ax —b, x > 0. 

(10a) 

Dual 

A T y + s = c. 

(10*) 

No lineal 

XSe - de = 0. 

(10c) 


El método de Newton requiere un paso Ax, Ay, As, a partir de las x, y, s, actuales. (És¬ 
tas resuelven las ecuaciones (10a) y (10í>), pero no la (10c).) Al ignorar el término de se¬ 
gundo orden AYA Se, ¡las correcciones provienen de ecuaciones lineales! 

A Ax = 0. 

A t A y + As = 0. 

S Ax + Y As = 9e - Y Se. 


Paso de Newton 


(lia) 

( 11 *) 

(11c) 
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Las notas de Robert Freund para su curso en el MIT afianzan la razón de convergencia 
(cuadrática) y la complejidad computacional de este algoritmo. Sin importar las dimensio¬ 
nes m y n, la brecha de dualidad sx suele estar abajo de 10~ 8 luego de entre 20 a 80 pasos 
de Newton. Este algoritmo se utiliza casi “como es” en software comercial de punto inte¬ 
rior, así como para una amplia variedad de problemas de optimización no lineal. 


Teoría de las desigualdades 

La dualidad puede estudiarse en más de una forma. Rápidamente se demostró yb < ex, y 
luego se aplicó el método simplex para obtener la igualdad. Esta es una prueba construc¬ 
tiva-, x* y y* se calculan en realidad. A continuación se aborda brevemente un método dife¬ 
rente, en el que se omite el algoritmo simplex, y se analiza más directamente la geometría. 
Considero que los conceptos clave son igualmente claros (de hecho, quizá más claros) si 
se omiten algunos detalles. 

La mejor ilustración de este método se encuentra en el Teorema Fundamental del Al¬ 
gebra Lineal. El problema en el capítulo 2 consistía en encontrar b en el espacio columna 
de A. Después de la eliminación y los cuatro subespacios, la cuestión de resolubilidad fue 
respondida en una forma completamente distinta por el problema 11 en la sección 3.1: 

■ ■'■y-.:..' " 

Srí Ax = b tiene una solución o existe una y tal que yA = 0 y yb ¥= 0. 

Este es el teorema de la alternativa, porque encontrar tanto a x como a y es imposible: si 
Ax = b entonces yAx = yb ^ 0, lo cual contradice a yAx — Ox = 0. En el lenguaje de los 
subespacios, b está en el espacio columna, o tiene una componente adherida en el espacio 
nulo izquierdo. Esta componente es la y que se busca. 

Para desigualdades, se desea encontrar un teorema que sea exactamente del mismo 
tipo. Se empieza con el mismo sistema Ax = b, pero se agrega la restricción x > 0. ¿Cuán¬ 
do existe una solución nonegativa de Ax = bl 

En el capítulo 2, b estaba en cualquier parte del espacio columna. Ahora sólo se per¬ 
miten combinaciones nonegativas, y las bs ya no llenan un subespacio. En vez de lo ante¬ 
rior, ocupan una región en forma de cono. Para n columnas en R OT , el cono se convierte en 
una pirámide de extremo abierto. En la figura 8.4 se muestran cuatro vectores en R 2 , y A 
es de 2 por 4. Si b está en este cono, existe una solución nonegativa de Ax = b; en caso 
contrario, no. 


columna 2 


plano de 
separación 


columna 4 


columna 3 


b está 
en el cono 1 


b estáí«|| 
fuera 
del cono 


Figura 8.4 Cono de las combinaciones nonegativas de las columnas: b — Ax con x > 0. 
Cuando b está fuera del cono, está separado por un hiperplano (perpendicular a y). 


8.3 El problema dual 


¿Cuál es la alternativa si b está fuera del cono ? En la figura 8.4 también se muestra 
un “hiperplano de separación” que tiene, al vector b en un lado y a todo el cono en el otro 
lado. El plano consta de todos los vectores perpendiculares a un vector fijo y. El ángulo en¬ 
tre y y b es mayor que 90°, por lo que yb < 0. El ángulo entre y y toda columna de A es me¬ 
nor que 90°, de modo que yA > 0. Esta es la alternativa que se buscaba. Este teorema del 
hiperplano de separación es fundamental para la economía matemática. 

■ 81 Ax = b tiene una solución nonegativa, o bien, existe una y con y A > 0 y yb < 0. 

Ejemplo 1 Las combinaciones nonegativas de las columnas de A = / llenan el cuadrante positivo 
b > 0. Para cualquier otra b, la alternativa debe cumplirse para alguna y: 


No está en 
el cono 


, entonces y 


0 1 ] proporciona y/ > 0 pero yb 


El eje x, perpendicular a y = [0 1], separa b del cono = cuadrante. 

A continuación se presenta un par de alternativas curiosas. Es imposible que un subes¬ 
pacio 5 y su complemento ortogonal S 1 - contengan vectores positivos. El producto interno 
debe ser positivo, no cero. Sin embargo, S podría ser el eje x y podría ser el eje y, en cu¬ 
yo caso contienen a los vectores “semipositivos” [1 0] y [0 1]. Esta alternativa ligeramen¬ 
te más débil funciona: Ya sea que S contiene un vector positivo x > 0, o que S x contiene 
un y > 0 diferente de cero. Cuando S y S x son rectas perpendiculares en el plano, una o la 
otra deben estar en el primer cuadrante. No puedo ver claramente esto en tres o cuatro di¬ 
mensiones. 

Para la programación lineal, las alternativas importantes provienen cuando las restric¬ 
ciones son desigualdades. ¿Cuándo ocurre que el conjunto factible es vacío (no x)? 

8J Ax > b tiene una solución x > 0 o bien, existe una y < 0 con vA > 0 y yb < 0. 

Demostración Las variables flojas w = Ax — b cambian a Ax > b en una ecuación. Se apli¬ 
ca 81: 


Primera alternativa 


Segunda alternativa 


[A -/] M =b 
L J I w 


para algún ^ > 0. 


y [A —/] > [0 0] para alguna y con yb < 0. 


Este es el resultado que conduce a una “demostración no constructiva” del teorema de dua¬ 
lidad. 


Conjunto de problemas 8.3 

1. ¿Cuál es el dual del siguiente problema: Minimizar X[ + x 2 , sujeto a xi > 0, x 2 > 0, 
2x! > 4, Xi +3x2 >11? Encuentre la solución de este problema y su dual, y com¬ 
pruebe que el mínimo es igual al máximo. 

2. ¿Cuál es el dual del siguiente problema: Maximizar y 2 , sujeto a yi > 0, y 2 > 0, 
y t + y 2 < 3? Resuelva este problema y su dual. 

3. Suponga que A es la matriz identidad (de modo que m = n), y que los vectores b y c 
son nonegativos. Explique por qué x* = b es óptimo en el problema del mínimo, en- 
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cuentee y* en el problema del máximo, y compruebe que los dos valores son iguales. 
Si la primera componente de b es negativa, ¿cuáles son x * y y*? 

4. Construya un ejemplo de 1 por 1 donde Ax > b, x > 0 es no factible, y el problema 
dual no esté acotado. 

5. Empezando con la matriz de 2 por 2 A — _°j, escoja b y c de modo que los dos 

conjuntos factibles Ax > ¿>, x > 0 y y A < c, y > 0 sean vacíos. 

6. Si todos los elementos de A, b, y c son positivos, demuestre que tanto el original co¬ 
mo el dual son factibles. 

7. Demuestre que x = (1, 1, 1, 0) y y = (1, 1, 0, 1) son factibles en el original y en el 
dual, con 

0 0 10] [1] Fl 

0 10 0 , 1 1 

1 1 1 1 ’ b= 1 ’ C= 1 

! 0 0 ij [lj [3 

Luego, después de calcular ex y yb, explique cómo se sabe que son óptimos. 

8. Verifique que los vectores en el ejercicio previo satisfacen las condiciones de flojedad 
complementarias en la ecuación (2), y encuentre la desigualdad floja tanto en el origi¬ 
nal como en el dual. 

9. Suponga que A = [¿ °], b = [_]], y c = [j]. Encuentre las x y y óptimas, y 
compruebe las condiciones de flojedad complementarias (así como yb = ex). 

10. Si el problema original se restringe por ecuaciones en vez de por desigualdades — Mi¬ 
nimizar ex sujeto a Ax = b y x > 0— luego, el requerimiento y > 0 se deja fuera del 
dual: Maximizar yb sujeto ayA < c. Demuestre que la desigualdad unilateral yb < ex 
sigue cumpliéndose. ¿Por qué en la ecuación (1) se requería y > 0 pero aquí no es ne¬ 
cesario? Esta dualidad débil puede completarse para dualidad total. 

11. a) Sin utilizar el método simplex, minimice el costo 5x¡ + 3x2 + 4x 3 , sujeto a 

X\ + X 2 + x 3 > 1 , x¡ > 0 , x 2 > 0 , x 3 > 0 . 

b) ¿Cuál es la forma del conjunto factible? 

c) ¿Cuál es el problema dual, y cuál es su solución y? 

12. Si el problema original tiene una solución única x, y luego c se modifica ligeramen¬ 
te, explique por qué x * sigue siendo la solución óptima. 

13. Escriba el dual del siguiente problema: Maximizar x¡ + x 2 + x 3 sujeto a 2x t + x 2 <4, 
x 3 < 6. ¿Cuáles son las x y y* óptimas (jen caso de existir!)? 

14. Si A = ¡J, describa el cono de combinaciones nonegativas de las columnas. Si b 

está dentro del cono, por ejemplo b = (3, 2), ¿cuál es el vector factible xl Si b está fue¬ 
ra, por ejemplo b — (0, 1), ¿qué vector y sigue satisfaciendo la alternativa? 

15. En tres dimensiones, ¿es posible encontrar un conjunto de seis vectores cuyo cono de 
combinaciones nonegativas llene todo el espacio? ¿Qué puede decir sobre cuatro vec¬ 
tores? 




E 8.4 MODELOS DE REDES 

Algunos problemas lineales tienen una estructura que llega muy rápido a su solución. Las 
matrices de banda tienen elementos diferentes de cero cerca de la diagonal principal, y es 
fácil resolver Ajc = b. En programación lineal, se tiene interés en la clase especial para la 
cual A es una matriz de incidencia. Sus elementos son — 1 o +1, o (en su mayoría) cero, 
y los pasos de pivoteo sólo implican sumas y restas. Es posible resolver problemas mucho 
más grandes que los de costumbre. 

Las redes se presentan en todo tipo de aplicaciones. La circulación en un crucero sa¬ 
tisface las leyes de la corriente de Kirchhoff: el flujo que entra es igual al flujo que sale. 
Para gas y petróleo, la programación de redes ha diseñado sistemas de conducción que son 
millones de dólares más baratos que los diseños intuitivos (no optimizados). ¡La programa¬ 
ción de pilotos, tripulaciones y aviones se ha convertido en un problema importante en 
matemáticas aplicadas! Incluso se resuelve el problema del matrimonio : maximizar el nú¬ 
mero de matrimonios cuando las novias están vetadas. Este problema puede no ser real, pe¬ 
ro es uno que resuelve la programación de redes. 

El problema en la figura 8.5 consiste en maximizar el flujo de la fuente al sumidero. 
Los flujos no pueden exceder las capacidades indicadas en las aristas, y las direcciones pro¬ 
porcionadas por las flechas no pueden invertirse. El flujo sobre las dos aristas hacia el su¬ 
midero no puede exceder 6+1=7. ¿Es posible alcanzar este total de 7? ¿Cuál es el flujo 
máximo de izquierda a derecha? 

Las incógnitas son los flujos x¡j del nodo i al nodo j. Las restricciones de capacidad son 
x¡j < c¡j. Los flujos son nonegativos: Xy > 0 en dirección de las flechas. Al maximizar el flu¬ 
jo de regreso x 6l (la recta punteada), se maximiza el flujo total hacia el sumidero. 



Figura 8.5 Red con 6 nodos con aristas de capacidad: el problema del flujo máximo. 
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Aún se escuchará hablar de otra restricción. Se trata de la “ley de conservación”: el flu¬ 
jo que entra en cada nodo es igual al flujo que sale de cada nodo. Esta es la ley de la co¬ 
rriente de Kirchhoff: 

Ley de la corriente ^ x ‘i ~~ 53 Xjk = 0 para i = 1,2,..., 6. 

í k 

Los flujos x. entran al nodo; provenientes de nodos previos ¿ Los flujos x jk no¬ 

do; a íodos posteriores k. El balance de la ecuación (1) puede¡ escribirse como Ax 0 
donde A es una matriz de incidencia nodo-arista (la traspuesta de la sección 2.5). A tiene 
una flecha por cada nodo y una columna +1,-1 para cada ansta: 


'11 1 

-1 1 1 
_1 1 1 

Matriz de A — _j — i 1 

incidencia — j —1 1 

-1 -1 1 

arista 12 13 24 25 34 35 46 56 61 


nodo 1 
2 

3 

4 

5 

6 


Flujo máximo Maximizar x 61 sujeto a Ax = 0 y 0 < x¡j < c¡j. 

Un flujo de 2 puede ir en la trayectoria 1-2-4-6-1. Un flujo de 3 puede ir a lo largo de 1-3- 
4-6-1. Un flujo adicional de 1 puede seguir la trayectoria más corta 1--3-5--6-1. El total 
6 , y nada más es posible. ¿Cómo se demuestra que el flujo maximal es 6 y no 7 - 

El método al tanteo es convincente, pero las matemáticas son concluyentes. La clave 
es encontrar un corte en la red, a través del cual todas las capacidades se llenen. Este cor¬ 
te separa los nodos 5 y 6 de los demás nodos. Las ansias que van directamente a través del 
corte Sien una capacidad total de 2 + 3 + 1 = 6, ¡y nada más puede cruzar La dualidad 
débil establece que cada corte constituye una cota para el flujo total, y la du^idad tote es 
tablece que el corte de menor capacidad (el corte minimal) se llena por el flujo maximal. 

8 SC Teorema del flujo máx-corte mín El flujo maximal en una red es igual a la 
capacidad total a través del corte minimal. 

Un “corte” separa los nodos en dos grupos S y T (fuente en S y sumidero en T). Su capa¬ 
cidad es la suma de las capacidades de todas las aristas que cruzan desde el corte (de : S a 
T) Varios cortes podrían tener la misma capacidad. Ciertamente, el flujo o a n ^ a P 
de ser mayor que la capacidad total a través del corte minimaLEl problema, aquiyeno- 
do lo que concierne a la dualidad, es demostrar que la igualdad se alcanza gracias al flujo 

y el corte idóneos. 

Demostración de que flujo máx = corte mín Suponga que un flujo es maximah Algu¬ 
nos nodos aún podrían alcanzarse desde la fuente mediante flujo adicional, sin exceder nin¬ 
guna de las capacidades. Estos nodos van con la fuente hacia el conjunto S. El sumider 
debe estar en el conjunto restante T, o bien, jhubieran recibido más flujo! Cada ansta a tra¬ 
vés del corte debe llenarse, o flujo adicional podría avanzar mas lejos hacia el nodo en . 
Así, el flujo maximal llena este corte a su capacidad y se ha alcanzado la igual a . 


8.4 Modelos de redes 
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Lo anterior sugiere una forma de construir el flujo maximal: Comprobar si alguna tra¬ 
yectoria posee una capacidad no utilizada. En caso de encontrar una, agregar flujo a lo lar¬ 
go de la “trayectoria aumentada”. Luego, calcular las capacidades restantes y decidir si el 
sumidero está cortado respecto a la fuente o si es posible añadir flujo adicional. Si cada no¬ 
do en S se identifica con el nodo previo del que pudo provenir el flujo, entonces es posible 
realizar un rastreo para encontrar la trayectoria del flujo adicional. 

ES problema def matrimonio 

Suponga que hay cuatro mujeres y cuatro hombres. Algunas de estas 16 parejas son com¬ 
patibles y otras no. ¿Cuándo es posible encontrar un emparejamiento completo , en la que 
todos estén casados? Si el álgebra lineal es capaz de trabajar en el espacio de dimensión 20, 
ciertamente puede manejar el problema trivial del matrimonio. 

Hay dos formas de presentar el problema: en una matriz o en una gráfica. La matriz 
contiene ay = 0 si la ¿-ésima mujer y el ;'-ésimo hombre no son compatibles, y % = 1 si 
están intentando ser compatibles. Así, el renglón i proporciona las opciones de la /-ésima 
mujer, y la columna j corresponde al ;-ésimo hombre: 

'1 0 0 0 ' 

Matriz de compatibilidad A = ¿ 0 0 1 ^ene ^ pares com P atib ^ es 

0 0 0 i 

La gráfica de la izquierda en la figura 8.6 muestra dos matrimonios posibles. Ignorando la 
fuente r y el sumidero t, tiene cuatro mujeres en la izquierda y cuatro hombres en la dere¬ 
cha. Las aristas corresponden a los ls en la matriz, y las capacidades son 1 matrimonio. 
Entre la primera mujer y el cuarto hombre no hay aristas, ya que la matriz tiene a¡ 4 = 0. 

Podría parecer que no es posible alcanzar el nodo M 2 por más flujo, ¡pero éste no es 
el caso! El flujo adicional a la derecha va de regreso para cancelar un matrimonio existen¬ 
te. Este flujo adicional realiza tres matrimonios, lo que es maximal. El corte minimal lo cru¬ 
zan 3 aristas. 

Un emparejamiento completo (en caso de ser posible) es un conjunto que tiene cuatro 
ls en la matriz. Éstos pueden provenir de cuatro renglones distintos y cuatro columnas di¬ 
ferentes, ya que no se permite la bigamia. Es como encontrar una matriz de permutación 
dentro de los elementos de A diferentes de cero. En la gráfica, esto significa cuatro aristas 
sin ningún nodo en común. El flujo maximal es menor que 4 exactamente cuando un em¬ 
parejamiento completo es imposible. 


1 



1 1 


Figura 8.6 Dos matrimonios a la izquierda, tres (máximo) a la derecha. El tercero es crea¬ 
do agregando dos nuevos matrimonios y un divorcio (flujo hacia atrás). 
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En nuestro ejemplo, el flujo maximal es 3, no 4. Se permiten los matrimonios 1-1, 2-2, 
4-4 (así como varios otros conjuntos de tres matrimonios), aunque no hay forma de lograr 
cuatro. El corte minimal a la derecha separa a las dos mujeres en el fondo de los tres hom¬ 
bres en la parte superior. Las dos mujeres sólo tienen un hombre restante para elegir, lo cual 
no es suficiente. La capacidad a través del corte es sólo de 3, 

Siempre que hay un subconjunto de k mujeres que deben decidir entre un conjun¬ 
to menor que k hombres, un emparejamiento completo es imposible. 

La prueba es decisiva. La misma imposibilidad puede plantearse en varias formas: 

1. (Para ajedrez) Resulta imposible poner cuatro peones en escaques que tienen ls en 
A, de modo que bajo enroque no es posible, puede comer a cualquier otro enroque. 

2. (Para matrices de matrimonio) Los ls en la matriz pueden cubrirse con tres líneas 
horizontales o verticales. Esto es igual al número de matrimonios. 

3. (Para álgebra lineal) Toda matriz con los mismos ceros que A es singular. 
Recuerde que el determinante es una suma de 4! = 24 términos. En cada término se utili¬ 
zan los cuatro renglones y columnas. Los ceros en A hacen cero a todos los 24 términos. 

¡Un bloque de ceros impide un emparejamiento completo! La submatriz de 2 por 3 en 
los renglones 3 y 4 y en las columnas 1, 2, 3 de A es completamente cero. La regla gene¬ 
ral para una matriz de n por n es que un bloque p por q de ceros impide un emparejamien¬ 
to si p + q > n. Aquí las mujeres 3, 4 sólo podrían casarse con 4 hombres. Si p mujeres 
pueden casarte con n — q y p > n — q hombres (lo cual es igual al bloque cero con p + 
q > n), de modo que un emparejamiento completo es imposible. 

El problema matemático es demostrar lo siguiente: si a todo conjunto de p mujeres le 
agrada por lo menos p hombres, un emparejamiento completo es imposible. Esta es la 
condición de Hall. Ningún bloque de ceros es demasiado grande. Cada mujer debe agra¬ 
darle por lo menos a un hombre; dadas dos mujeres, una de ellas debe agradarle por lo me¬ 
nos a dos hombres, y así sucesivamente, hasta p — n. 


8L Un emparejamiento completo es posible si (y sólo si) se cumple la condición de 
Hall. . 


La demostración es más sencilla si las capacidades son n, en vez de 1, sobre todas las 
aristas a través de la parte de en medio. Las capacidades que salen de la fuente y se dirigen 
hacia el sumidero siguen siendo 1. Si el flujo maximal es n, entonces las aristas que van de 
la fuente al sumidero están llenas, y el flujo produce n matrimonios. Cuando un empareja¬ 
miento completo es imposible y el flujo máximo está por abajo de n, algún corte debe ser 
responsable. 

Ese corte mantiene a la capacidad por abajo de n, de modo que las aristas de en me¬ 
dio la cruzan. Suponga que p nodos a la izquierda y r nodos a la derecha están en el con¬ 
junto S con la fuente. La capacidad a través de ese corte está a n — p de la fuente a las 
mujeres restantes, y a r de estos hombres al sumidero. Debido a que la capacidad de corte 
está por debajo de n, las p mujeres sólo agradan a los r hombres y a ningún otro. Sin em¬ 
bargo, la capacidad n — p + r está por abajo de n exactamente cuando p > r, y la condi¬ 
ción de Hall fracasa. 

Árboles generadores y el algoritmo avaro 

Uno de los modelos fundamentales de redes es el problema de la ruta mínima, donde las 
aristas tienen longitudes en vez de capacidades. Se busca la ruta más corta de la fuente al 


r 
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sumidero. Si las aristas son líneas telefónicas y las longitudes son tiempos de retraso, se es¬ 
tá encontrando la ruta más rápida para una llamada. Si los nodos son computadoras, se 
está buscando el protocolo perfecto para pasar el mensaje. 

Un problema estrechamente relacionado encuentra el árbol generador más corto: un 
conjunto de n — 1 aristas que unen todos los nodos de la red. En vez de ir rápidamente de 
una fuente a un sumidero, ahora se está minimizando el costo de conectar todos los nodos. 
No hay ciclos porque el costo de cerrar un ciclo es innecesario. Un árbol generador conec¬ 
ta los nodos sin ciclos, y se desea encontrar el más corto. A continuación se presenta un al¬ 
goritmo posible: 

1. Se empieza en cualquier nodo s y se repite el paso siguiente: 

Sumar la arista más corta que une el árbol actual a un nuevo nodo. 

En la figura 8.7, las longitudes de las aristas se observan en el orden 1, 2, 7, 4, 3, 6. El úl¬ 
timo paso omite la arista de longitud 5, que cierra un ciclo. La longitud total es 23, pero, 
¿es mínimo? La arista de longitud 7 se aceptó muy fácil, y el segundo algoritmo propor¬ 
ciona una longitud más larga. 



Figura 8.7 Red y árbol generador más corto de longitud 23. 


2. Aceptar las aristas en orden creciente de longitud, rechazando las aristas que comple¬ 
tan un ciclo. 

Ahora las aristas se presentan en el orden 1, 2, 3, 4, 6 (rechazando 5 de nuevo), y 7. 
Son las mismas aristas, aunque esto no ocurre siempre. Su longitud total es la misma, lo 
cual ocurre siempre. El problema del árbol generador es excepcional, porque puede re¬ 
solverse en un paso. 

En el lenguaje de la programación lineal, primero se está encontrando el vértice ópti¬ 
mo. El problema del árbol generador se resuelve como en la sustitución hacia atrás, sin pa¬ 
sos falsos. Este método general se denomina algoritmo avaro. A continuación se presenta 
otra idea codiciosa: 

3. Construir árboles a partir de todos los n nodos, repitiendo el paso siguiente: 
Seleccionar cualquier árbol y sumar la arista de longitud mínima que sale de ese árbol. 

Los pasos dependen del orden de selección de los árboles. Para permanecer en el mismo 
árbol es el algoritmo 1. Tomar las longitudes en orden es el algoritmo 2. Barrer a través de 
todos los árboles a la vez es un nuevo algoritmo. Se oye muy fácil, pero para un gran pro¬ 
blema la estructura de los datos se vuelve crítica. Con mil nodos, podría haber cerca de un 
millón de aristas, y no es recomendable repasar - esta lista mil veces. 

Modelos de redes adicionales 

Los siguientes problemas están relacionados para hacer coincidir y son casi tan fáciles: 

1. El problema de la asignación óptima: a¡j mide el valor del aspirante i al puesto j. Asig¬ 
nar puestos para maximizar el valor total —la suma de los ay sobre los puestos asig¬ 
nados. (Si todos los a¡j son 0 o 1, este es el problema del matrimonio.) 
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2. El problema de transporte: Dados suministros en n puntos y demandas en n merca¬ 
dos, escoger embarques x tj de los proveedores a los mercados que minimicen el costo 
total CijX¡j. (Si todos los suministros y las demandas son 1, este es el problema de 
la asignación óptima: enviar una persona a cada puesto.) 

3. Flujo de costo mínimo: Ahora las rutas tienen capacidades c¡¡, así como costos Cy, 
mezclando el problema de flujo máximo con el problema de transporte. ¿Cuál es el 
flujo más barato, sujeto a restricciones de capacidad? 

Una parte fascinante de este tema es el desarrollo de algoritmos. En vez de una demos¬ 
tración teórica de la dualidad, se usa primera búsqueda de amplitud o primera búsqueda 
de profundidad para encontrar la asignación óptima o el flujo más barato. Es como el mé¬ 
todo simplex, ya que empieza con un flujo factible (un vértice) y suma un nuevo flujo (el 
desplazamiento hacia el siguiente vértice). Los algoritmos son especiales porque los pro¬ 
blemas de redes implican matrices de incidencia. 

La técnica de programación dinámica se apoya en un concepto simple: Si una ruta de 
una fuente a un sumidero es óptima, entonces cada parte de la ruta debe ser óptima. La 
solución es construir hacia atrás a partir del sumidero, en un proceso de decisión de etapas 
múltiples. En cada etapa, la distancia al sumidero es el mínimo de una nueva distancia más 
una distancia anterior: 

Ecuación de Beiíman distancia x-t — mínimo sobre y de (distancias x-y + y-t). 

Me hubiese gustado tener más espacio sobre redes. Son simples y hermosas. 

Conjunto de problemas 8.4 

1. En la figura 8.5, sume 3 a cada capacidad. Por inspección, encuentre el flujo máximo 
y el corte mínimo. 

2. Encuentre un flujo máximo y el corte mínimo para la siguiente red: 



3. Si es posible incrementar la capacidad de cualquier tubo en la red de la figura anterior, 
¿qué cambio provocaría el mayor incremento en el flujo máximo? 

4. Trace una red de cinco nodos con capacidad \i — j\ entre el nodo i y el nodo j. Encuen¬ 
tre el máximo flujo posible del nodo 1 al nodo 4. 

5. En una gráfica, el número máximo de rutas de s a t sin aristas comunes es igual al nú¬ 
mero mínimo de aristas cuya eliminación desconecta s de t. Relacione esto con el teo¬ 
rema del flujo máximo-corte mínimo. 


6. Encuentre un conjunto máximo de matrimonios (un emparejamiento completo, de ser 
posible) para 
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Trace la red para B, con líneas más gruesas en las aristas de los emparejamientos. 

7. Para la matriz A del problema 6, ¿qué renglones violan la condición de Hall al tener 
todos sus ls en muy pocas columnas? ¿Qué submatriz de ceros de p por q cumple p + 
q> n! 

8. ¿Cuántas rectas (horizontales y verticales) se requieren para cubrir todos los unos en 
la matriz A del problema 6? Para cualquier matriz, explique por qué la dualidad débil 
es cierta: si k matrimonios son posibles, entonces se requieren por lo menos k rectas 
para cubrir todos los ls. 

9. a) Suponga que cada renglón y cada columna contienen exactamenten dos ls. De¬ 

muestre que un emparejamiento completo es posible. (Demuestre que no es posi¬ 
ble cubrir los ls con menos de n rectas.) 

b) Encuentre un ejemplo con dos o más ls en cada renglón y cada columna, para el 
cual un emparejamiento completo es imposible. 

10. Si una matriz de 7 por 7 tiene 15 ls, demuestre que permite por lo menos tres matri¬ 
monios. 

11. Para conjuntos infinitos , un emparejamiento completo puede ser imposible incluso si 
se cumple la condición de Hall. Si todo el primer renglón es de ls y entonces cada 
a,¡_t = 1, demuestre que p renglones cualesquiera contienen ls en por lo menos p co¬ 
lumnas; y ni así se tiene un emparejamiento completo. 

12. Si la figura 8.5 muestra longitudes en vez de capacidades, encuentre la ruta más corta 
de y a í, y un árbol generador mínimo. 

13 . Aplique los algoritmos 1 y 2 para encontrar un árbol generador mínimo para la red del 
problema 2. 

14. a) ¿Por qué el algoritmo avaro es válido para el problema del árbol generador? 

b ) Demuestre con un ejemplo que el algoritmo avaro podría fracasar en encontrar la 
ruta más corta de s a f, empezando con la arista más corta. 

15. Si A es la matriz de 5 por 5 con ls justo arriba y abajo de la diagonal principal, en¬ 
cuentre 

a) Un conjunto de renglones con ls en muy pocas columnas. 

b) Un conjunto de columnas con ls en muy pocos renglones. 

c) Una submatriz de ceros de p por q con p + q > 5. 

d ) Cuatro rectas que cubran a todos los ls. 

16. El problema de flujo máximo tiene variables flojas w¡j = Cy — Xy para la diferencia en¬ 
tre capacidades y flujos. Formule el problema de la figura 8.5 como un programa lineal. 
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EE 8.5 TEORÍA DE JUEGOS 

La mejor manera de explicar un juego de suma-cero de dos personas es mediante un ejem¬ 
plo. Hay dos jugadores X y Y, y las reglas son las mismas en cada tumo: 

X tiene una mano o dos, así como Y. Si toman la misma decisión, Y gana $10. Si 
toman decisiones opuestas, X gana $10 por una mano y $20 por dos: 

Matriz de pagos A _ [ -10 20 j una mano por Y 

(pagos a 20 10 —10 J . .. dos manos por L. 

una mano dos manos 
por X por X 

Si X hace lo mismo cada vez, Y lo imitará y ganará. De manera semejante, Y no puede 
adherirse a una sola estrategia, o X hará lo contrario. Ambos jugadores deben usar una es¬ 
trategia mezclada, y la elección en cada tumo debe ser independiente de los tumos pre¬ 
vios. Si hay algún patrón histórico, el oponente puede aprovecharlo. Incluso la estrategia 
“quedarse con la misma opción hasta perder” es evidentemente fatal. Luego de suficien¬ 
tes juegos, el oponente debe saber exactamente qué esperar. 

En una estrategia mezclada, X puede poner una mano con una frecuencia x x y ambas 
manos con frecuencia^ = 1 — x x . En cada tumo, esta decisión es aleatoria. De manera se¬ 
mejante, Y puede escoger probabilidades y, y y 2 = 1 — y x - Ninguna de estas probabilida¬ 
des debe ser 0 o 1; en caso contrario, el oponente ajusta su estrategia y gana. Si son iguales 
a I, Y perdería $20 muy a menudo. (Podría perder $20 la cuarta parte del tiempo, $10 otra 
cuarta parte del tiempo, y ganar $10 la mitad del tiempo, lo cual supone una pérdida me¬ 
dia de $2.50. Esto es más de lo necesario.) Pero mientras Y se mueve más hacia una estra¬ 
tegia pura de dos manos, más se moverá X hacia una mano. 

El problema fundamental es encontrar las mejores estrategias mezcladas. ¿ X puede 
escoger probabilidades x x y x 2 que presenten a Y sin razón para moverse en su propia es¬ 
trategia (y viceversa)? Entonces el pago medio habrá alcanzado un punto silla: es máximo 
en tanto X esté preocupado, y es mínimo en tanto Y esté preocupado. Encontrar este punto 
silla es resolver el juego. 

X combina las dos columnas con pesos x x y 1 — x x para producir una nueva columna 
“mezclada”. Los pesos ~ y | deben producir esta columna: 

Columna mezclada - + - ^2 

5 [ ÍOJ 5 [-10 

Contra esta estrategia mezclada, Y siempre pierde $2. ¡Esto no significa que todas las 
estrategias son óptimas para Y\ Si Y es flojo y se queda con una mano, X cambiará y em¬ 
pezará a ganar $20. Luego Y cambiará, y luego también lo hará X. Finalmente, como se 
supone que ambos son inteligentes, se quedarán en estrategias mezcladas óptimas. Y com¬ 
binará los renglones con los pesos y¡ y 1 — y x , tratando de producir un nuevo renglón que 
sea lo más pequeño posible: 

Renglón mezclado y! [—10 20] +(1—yi)[l0 —10] = [10—20yi — 10+30yi]. 

La mezcla correcta hace iguales a las dos componentes, en yi = |. Luego, hace iguales a 
2 a ambas componentes; el renglón mezclado se vuelve [2 2]. Con esta estrategia Y no 
puede perder más de $2. 
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Y ha minimizado la pérdida máxima, y este minimax coincide con el maximin encontrado 
por X. El valor del juego es minimax = maximin = $2. 

¡La mezcla óptima de renglones puede no siempre tener elementos iguales! Suponga 
que al se permite una tercera estrategia de mantener hasta tres manos para ganar $60 cuan¬ 
do Y pone una mano y $80 cuando Y pone hasta dos. La matriz de pagos se convierte en 


-10 20 60' 

10 -10 80 ' 


X escogerá la estrategia de las tres manos (columna 3) cada vez, y ganará por lo menos $60. 
Al mismo tiempo, Y siempre escoge el primer renglón; la pérdida máxima es $60. Sigue 
teniéndose maximin = minimax = $60, pero el punto silla está en el vértice. 

En la mezcla óptima de renglones de Ys, que era puramente el renglón 1, $60 aparece 
sólo en la columna realmente utilizada por X. En la mezcla óptima de columnas de Xs, que 
era la columna 3, $60 aparece en el renglón que entra en la mejor estrategia de Ks, Esta 
regla corresponde exactamente a la condición floja complementaria de la programación 
lineal. 


Juegos matriciales 

El “juego matricial de m por n” más general, es exactamente como nuestro ejemplo. X tie¬ 
ne n posibles movimientos (columnas de A). Y escoge de los m renglones. El elemento a¡¡ 
está en la matriz de pagos cuando X escoge la columna j y Y escoge el renglón i. Un ele¬ 
mento negativo significa un pago a Y. Este es un juego de suma-cero. Lo que pierde un ju¬ 
gador lo gana el otro. 

X es libre de escoger cualquier estrategia mezclada x = (x u . . . , x„). Estos x¡ propor¬ 
cionan las frecuencias para las n columnas, cuya suma es 1. En cada tumo, X utiliza un me¬ 
canismo aleatorio para producir la estrategia i con frecuencia x¡. Y escoge un vector y = 
(yo • • •» y m )< también con y¡ > 0 y = 1, que proporciona las frecuencias para seleccio¬ 
nar los renglones. 

Una simple jugada del juego es aleatoria. En promedio, la combinación de la colum¬ 
na./ para X y del renglón i para Y aparece con probabilidad x¡y¡. Cuando se presenta, el pa¬ 
go es a¡j. El pago esperado para X a partir de esta combinación es "jX Y/ a¡¡Xj y¡ = y Ax : 


«n a X 2 

yAx = [>i ■■■ y m ] \ : 

a m \ a m 2 



W 

X 2 

= a u xiyi+■ • •+a mn x n y m 
: = Pago medio. 

■^n 


Este es el pago yAx que X quiere maximizar y Y quiere minimizar. 


Ejemplo 1 Suponga que A es la matriz identidad de n por n, A = I. El pago esperado se vuelve ylx — 
x x y i + • • ■ + x n y n - X espera encontrar la misma opción que Y, ganar a u = $1. Y está in¬ 
tentando evadir a X, pagar a¡j = $0. Si X escoge cualquier columna más a menudo que otra, 
Y puede escapar más a menudo. La mezcla óptima es x * = (1/n, 1/n,..., 1/n). 
De igual manera, Y no puede preferir a ningún renglón, ya que la mezcla óptima es 
y* = {1/n, 1/n,..., 1/n). La probabilidad de que ambos escojan la estrategia i es <l/n) 2 , 
y la sumatoria sobre i es el pago esperado a X. El valor total del juego es n veces (1/n) 2 , o 
l/n: 
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y* Ax* = [Un 



1 

n 


Cuando n crece, Y tiene mejores posibilidades de escapar. El valor i/n baja. t _ 

La matriz simétrica A = / no hizo justo el juego. Una matriz simétrica sesgada, A = 
—A, significa un juego completamente justo. Así, una elección de la estrategia y por X e i 
por Y gana a¡ para X, y la elección de j por Y e i por X gana la misma cantidad para Y (por¬ 
que a-i = —a¡¡). Las estrategias óptimas x y y * deben ser las mismas, y el pago esperado 
debe ser y*Ax = 0. El valor del juego, cuando A T = —A, es cero. Aunque aún es necesa¬ 
rio encontrar la estrategia. 


Ejemplo 2 


Juego justo 



-1 

0 

1 


-1 

-1 

0 


En palabras, ambos X y Y escogen un número entre 1 y 3. La elección más pequeña gana 
$ 1 . (Si X escoge 2 y Y escoge 3, el pago es a 32 - $1; si escogen el mismo número, se es¬ 
tá en la diagonal y nadie gana.) Ningún jugador puede escoger una estrategia que implique 
2 o 3. Las estrategias puras x = y* = (1, 0, 0) son óptimas: ambos jugadores escogen 1 
cada vez. El valor es y*Ax = a n =0. 

La matriz que deja sin cambio a todas las decisiones tiene mn elementos iguales, por 
ejemplo a. Esto significa simplemente que X gana una cantidad adicional c^en cada tumo. 
El valor del juego se incrementa por a, pero no hay razón para cambiar a x y y . 


El teorema minimax 

Póngase en el lugar de X, quien escoge la estrategia mezclada x = (jc t ,..., x n ). Y termina¬ 
rá por reconocer esa estrategia y escogerá y para minimizar el pago yAx. Un jugador inte¬ 
ligente X elegirá x* para maximiz.ar este mínimo: 

X gana por lo menos mín yAx* = máx mín yAx. (1) 


El ju gado r Y hace lo contrario. Para cualquier estrategia elegida y, X maximizará yAx. 
En consecuencia, Y escogerá la mezcla y* que minimiza este máximo : 

Y pierde no más de máx y * Ax = mín máx yAx. (2) 

Espero que el lector se dé cuenta cuál será el resultado clave, si es cierto. Se quiere que 
la cantidad en la ecuación (1) que se garantiza que X ganará sea igual a la cantidad en la 
ecuación (2) que Y debe estar satisfecho de perder. Así se resolverá el juego: X puede ga¬ 
nar sólo moviéndose a partir de x* y Y puede perder sólo moviéndose a partir de y*. La exis¬ 
tencia de este punto silla fue demostrada por Von Neumann. 



8M Para cualquier matriz A, el minimax sobre todas las estrategias es igual al má¬ 
ximo: 

Teorema minimax máx mín yAx = mín máx yAx = valor del juego. (3) 

x y y x 

Si el máximo en la izquierda se alcanza en x”, y el mínimo en la derecha se alcanza 
en y’, este es un punto silla a partir del que nadie quiere moverse: 

y*Ax < y*Ax* < yAx* para toda x y y (4) 

En este punto silla, x es por lo menos tan bueno como cualquier otro x (ya que y*Ax < 
y*Ax*). Y el segundo jugador Y sólo puede pagar más si abandona y*. 

Así como en la teoría de dualidad, maximin < minimax es fácil. En la ecuación (1) se 
combina la definición de x*, y en la ecuación (2) se combina la definición de y*: 

máxmín yAx = mín yAx * < y*Ax* < máx y*Ax = mínmáx yAx. (5) 

X y y x y x 

Esto sólo afirma que si es posible garantizar que X gane por lo menos a, y que Y pierda no 
más de /3, entonces a < /3. El logro de Von Neumann fue demostrar que a = /3. El teo¬ 
rema minimax significa que la igualdad debe cumplirse en toda la ecuación (5). 

Para nosotros, lo extraordinario sobre la demostración es que utiliza exactamente los 
mismos procedimientos matemáticos que la teoría de la programación lineal. X y Y desem¬ 
peñan roles “duales”. Ambos escogen estrategias del “conjunto factible” de vectores de 
probabilidad: x¡ > 0, 53 x ¡ = 1 , y¡ > 0, 53 Yt = 1 • Lo emocionante es que incluso Von Neu¬ 
mann no reconoció de inmediato ambas teorías como la misma. (Demostró el minimax en 
1928, la programación lineal comenzó antes de 1947, y Gale, Kuhn, y Tucker publicaron 
la primera demostración de la dualidad en 1951, ¡con base en notas de Von Neumann!) Es¬ 
tamos invirtiendo la historia para deducir el teorema minimax a partir de la dualidad. 

En breve, el teorema minimax puede demostrarse como sigue. Sean b el vector colum¬ 
na de m Is, y c el vector renglón de n ls. Estos programas lineales son duales: 
minimizar ex, maximizar yb, 

sujeto a Ax > b, x > 0 sujeto a y A < c, y > 0. 

Para tener la certeza de que ambos problemas son factibles, a todos los elementos de A se 
suma un gran número a. Esto no puede afectar las estrategias óptimas, ya que cada pago 
asciende por a. Para la matriz resultante, que sigue denotándose por A, y = 0 es factible en 
el dual y cualquier x grande es factible en el original. 

El teorema de dualidad de programación lineal garantiza x y y* óptimos con ex* = 
y"b. Debido a los ls que hay en b y en c, esto significa que 53 x* = 53 Y* = 5 • La divi¬ 
sión entre 5 cambia las sumas a 1, y las estrategias mezcladas resultantes x*/S y y'/S son 
óptimas. Para cualesquiera otras estrategias x y y, 

Ax* > b implica yAx* > yb = 1 y y*A < c implica y*Ax < ex = 1. 

La cuestión más importante es que y* Ax < 1 < yAx*.Al dividir entre 5, esto indica que 
el jugador X no puede ganar más que 1/5 contra la estrategia y*/S, y que el jugador X no 
puede perder más que 1/5 contra x*/5. Estas estrategias proporcionan maximin = mini¬ 
max = 1/5. 
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Juegos verdaderos 

Con esto se completa la teoría, aunque queda una pregunta natural: ¿Cuáles juegos norma¬ 
les son equivalentes a los “juegos matriciales”? El ajedrez, el bridgey el póquer, ¿se ajus¬ 
tan a la teoría de Von Neumann l 

Considero que el ajedrez no se ajusta muy bien, por dos razones. Una estrategia para 
las negras debe incluir una decisión de cómo contestar a la primera jugada de las blancas, 
a la segunda jugada y así sucesivamente hasta el final del juego. X y Y tienen millones de 
estrategias puras. No veo mucho sobre el papel del azar. Si las blancas pueden encontrar 
una estrategia ganadora, o si las negras pueden encontrar una estrategia inspirada —ningu¬ 
na de estas posibilidades se ha descubierto— eso podría efectivamente terminar el juego 
del ajedrez. Puede jugarse como tic-tac-toe (gato), aunque la emoción se perdería. 

El bridge contiene algo decepcionante, como en un impasse. Se considera como un jue¬ 
go matricial, aunque de nuevo m y n son fantásticamente grandes. Quizá sea posible anali¬ 
zar parte por separado del bridge para encontrar una estrategia óptima. Lo mismo es válido 
para el béisbol, donde el pítcher y el bateador tratan de adivinar la elección del otro acerca 
del lanzamiento. (O bien el cátcher intenta adivinar cuándo el conredor se robará una base. 
Una “bola” cada vez otorga al bateador “base por bolas”, de modo que debe haber una fre¬ 
cuencia óptima —dependiendo del corredor en base y de la situación.) De nuevo, una parte 
del juego puede aislarse para su análisis. 

Por otro lado, el blackjack no es un juego matricial (en un casino) porque sigue reglas 
fijas. Mi amigo Ed Thorp encontró una estrategia ganadora mediante el conteo de cartas al¬ 
tas, obligando a barajar más y más naipes en Las Vegas. No había ningún elemento de azar, 
y tampoco ninguna estrategia x . El éxito editorial Bringing Down the House afirma cómo 
estudiantes del MIT ganaron bastante dinero (mientras no estaban haciendo sus deberes). 

También está el dilema del prisionero, en ei que a dos cómplices se les ofrece por sepa¬ 
rado el mismo trato: confiesa y eres libre, en el supuesto de que tu cómplice no confiese (así, 
ei cómplice obtiene 10 años de prisión). Si ambos confiesan, cada uno es condenado a 6 años 
de cárcel. Si ninguno confiesa, sólo es posible probar un delito menor (2 años de prisión a 
cada uno). ¿Qué hacer? La tentación por confesar es muy grande, aunque si pueden depen¬ 
der mutuamente, saldrían libres. Este no es un juego de suma-cero: ambos pueden perder. 

Un ejemplo de juego matricial es el póquer. La simulación o fingimiento (bluffing) es 
esencial, y para que sea efectiva debe ser impredecible. (Si su oponente descubre un pa¬ 
trón, usted está perdido). Las probabilidades en pro y en contra de fingir dependen de las 
cartas que estén a la vista, así como de las apuestas. De hecho, nuevamente el número de 
alternativas hace impráctico encontrar una estrategia absolutamente óptima x*. Un buen ju¬ 
gador de póquer debe aproximarse bastante ax*, y ésta puede calcularse exactamente si se 
acepta la siguiente simplificación enorme del juego: 

X recibe una jota o un rey, con igual probabilidad, y Y siempre recibe una reina. X puede 
pasar y perder la apuesta de $1, o subir la apuesta por $2 adicionales. Si X apuesta, Y pue¬ 
de pasar y perder $1, o pagar los $2 adicionales y averiguar si X está fingiendo. Luego, la 
carta más alta gana los $3 del oponente. Así, Y tiene dos posibilidades, en reacción a X 
(quien tiene cuatro estrategias): 

Estrategias (Renglón 1) Si X apuesta, Y pasa. 

para Y (Renglón 2) Si X apuesta, Y paga los $2 adicionales. 

Estrategias 1) Apostar los $2 adicionales al rey y pasar con una jota, 

para X 2) Apostar los $2 adicionales en cualquier caso (fingir). 

3) Pasar en cualquier caso, y perder $1 (lo cual es una tontería). 

4) Pasar con el rey y apostar con una jota (lo cual es una tontería). 
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Para calcular la matriz de pagos A se requiere un poco de paciencia: 

«u = 0: X pierde $1 la mitad del tiempo en una jota y gana con un rey (Y pasa). 

a 2 i — 1: En ambas apuestas X pierde $1 la mitad del tiempo y gana $3 la mitad 

del tiempo. 

a i 2 =l: X apuesta y Y pasa (la simulación tuvo éxito). 

a u = 0: X gana $3 con el rey y pierde $3 con la jota (el fingimiento fracasa). 

Matriz de pagos del póquer A = 

La estrategia óptima para X es fingir la mitad del tiempo, x* = (i i 0, 0). El probable 
perdedor Y debe escoger y* = (i, |).E1 valor del juego es 50 centavos para X. 

Esta es una forma extraña de terminar este libro, enseñando cómo jugar un póquer sua¬ 
vizado (el blackjack paga mucho más). Sin embargo, me imagino que incluso el póquer tie¬ 
ne su sitio dentro del álgebra lineal y sus aplicaciones. Espero que haya disfrutado el libro. 


'0 1 -1 0 ' 

1 0 -1 -2 • 


Conjunto de problemas 8.5 

1. ¿De qué forma son afectadas las estrategias óptimas en el juego con que empieza esta 
sección si los $20 se incrementan a $70? ¿Cuál es el valor (la ganancia media para X) 
de este nuevo juego? 

2. Con la matriz de pagos A = ^ , explique los cálculos por X del maximin y por Y 

del minimax. ¿Cuáles son las estrategias óptimas x" y y*? 

3. Si a¡j es el mayor elemento en su renglón y el más pequeño en su columna, ¿X siem¬ 
pre escogerá la columna) y Y siempre escogerá el renglón i (sin importar el resto de 
la matriz)? Demuestre que el problema precedente tenía tal elemento, y luego constru¬ 
ya A sin uno. 

4. Calcule la mejor estrategia de Ys ponderando los renglones de A = l 3 j con 

y y 1 — y. X se centrará en la mayor de las componentes 3y + 2(1 — y). 4y, y y + 
3(1 — y). Encuentre la más grande de estas tres (dependiendo de y), y luego encuen¬ 
tre la y * entre 0 y 1 que hace que esta componente sea lo más pequeña posible. 

5. Con la misma A que en el problema 4, encuentre la mejor estrategia para X. Demues¬ 
tre que X sólo usa las dos columnas (la primera y la tercera) que se encuentran en el 
punto minimax en la gráfica. 

6. Encuentre tanto las estrategias óptimas como el valor, si 



7. Suponga que A — ¿j. ¿Qué pesos x¡ y 1 — jc 1 proporcionan una columna de la 

forma [u m] t y qué pesos y x y 1 — y, proporcionan un nuevo renglón [t> u]? Demues¬ 
tre que u = v. 
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8 . Encuentre x, y* y el valor v para 


'10 0 ' 

A = 0 2 0 . 

0 0 3 


9. Calcule 


mín máx (jqyi + xzyD- 

y¡ > 0 x¡ > 0 

y\ + n - 1 + *2 = i 


10. Explique cada una de las desigualdades en la ecuación (5). Luego, una vez que el teo¬ 
rema minimax la transforma en igualdades, deduzca (otra vez con palabras) las ecua¬ 
ciones del punto silla (4). 

11. Demuestre que x* = (\, ±, 0, 0) y y* = (\, 5 ) son estrategias óptimas en nuestra 
versión simplificada del póquer, calculando yAx* y y *Ax, y comprobando las condicio¬ 
nes (4) para un punto silla. 

12. ¿Ya se ha demostrado que ninguna estrategia de ajedrez hace ganar a las negras? Esto 
es ciertamente verdadero cuando se permite que los jugadores realicen dos movimien¬ 
tos a la vez; si las negras tienen una estrategia ganadora, las blancas podrían adelantar 
y retroceder un caballo y después seguir esa estrategia, llegando a la conclusión impo¬ 
sible de que ambos pueden ganar. 

13. Si X escoge un número primo y simultáneamente Y adivina si es par o impar (con ga¬ 
nancia o pérdida de $ 1 ), ¿quién tiene la ventaja? 

14. Si X es un mariscal de campo de fútbol americano, con la opción de correr o lanzar un 
pase, y Y puede defender contra una carrera o un pase, suponga que el pago (en yar¬ 
das) es 


A = 


2 81 defensa contra la carrera 

6 —6 defensa contra el pase. 


correr pasar 


¿Cuáles son las estrategias óptimas y la ganancia media en cada jugada? 
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t. La intersección de dos espacios vectoriales 

Al considerar dos subespacios V y W en vez de sólo uno, surgen nuevas preguntas. Prime¬ 
ro se consideran los vectores que pertenecen a ambos subespacios. Esta “intersección” 
V n W es un subespacio de estos subespacios. 

Si V y W son subespacios de un espacio vectorial, también lo es su intersección 

V n W. Los vectores que pertenecen tanto a V como a W constituyen un subes- 

pacio. 

Suponga que x y y son vectores que están en V y también en W. Debido a que V y W 
son espacios vectoriales por derecho propio, x + y y ex están en Y y en W. Los resultados 
de la suma y la multiplicación escalar también están en la intersección. 

Dos planos que pasan por el origen (o dos “hiperplanos” en R") se cortan en un subes¬ 
pacio. La intersección de varios subespacios, o de un número infinito también es un 
subespacio. 

Ejemplo 1 La intersección de dos subespacios ortogonales V y W es el subespacio Y n W = {0} que 
consta de un solo punto. Sólo el vector cero es ortogonal a sí mismo. 

Ejemplo 2 Suponga que V y W son los espacios de matrices triangulares superior e inferior de n por 
n. La intersección V n W es el conjunto de matrices diagonales, que pertenecen a ambos 
subespacios triangulares. El resultado de sumar matrices diagonales, o de multiplicarlas por 
c, es una matriz diagonal. 

Ejemplo 3 Suponga que V es el espacio nulo de A y que W es el espacio nulo de B. Entonces V n W 
es el menor espacio nulo de la matriz más grande C: 

Intersección de espacios nulos N(A) n N(B) es el espacio nulo de C = 

Cx = 0 requiere tanto Ax = 0 como Bx = 0. Así, x tiene que pertenecer a ambos espacios 
nulos. 
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2. La suma de dos espacios vectoriales 

Casi siempre, después de analizar la intersección de dos conjuntos, resulta natural estudiar 
su unión. Con espacios vectoriales esto no es natural. La unión V U W de dos subespacios 
en general no es un subespacio. Si V y W son el eje x y el eje y en el plano, los dos ejes 
juntos no son un subespacio. La suma de (1, 0) y (0, 1) no está en ninguno de estos ejes. 
Se desea combinar V y W. En vez de estudiar su unión, lo hacemos con su suma. 

DEFINICIÓN Si V y W son subespacios de un espacio dado, también lo es su suma. V + 
W contiene a todas las combinaciones v + w, donde v está en V y uj está en W. 

V + W es el menor espacio vectorial que contiene tanto a V como a W. La suma del 
eje x y del eje y es todo el plano x-y, como también lo es la suma de dos rectas distintas 
cualesquiera, sean perpendiculares o no. Si V es el eje x y W es la recta x = y a 45°, en¬ 
tonces cualquier vector como (5, 3) puede separarse en v + w — (2, 0) + (3, 3). Así, V + 
W es todo R 2 . 


Ejemplo 4 Suponga que V y W son complementos ortogonales en R". Entonces su suma es V + W = 
R' 1 . Todo x es la suma de sus proyecciones en V y W. 

Ejemplo 5 Si V es el espacio de matrices triangulares superiores y W es el espacio de matrices trian¬ 
gulares inferiores, entonces V + W es el espacio de todas las matrices. Toda matriz de n 
por n puede escribirse como la suma de una matriz triangular superior y una matriz trian¬ 
gular inferior —de muchas formas, ya que las diagonales no están determinadas de mane¬ 
ra única. 

Estos subespacios triangulares tienen dimensión n(n + l)/2. El espacio V + W de to¬ 
das las matrices dene dimensión n 2 . El espacio V fl W de las matrices diagonales tiene di¬ 
mensión n. La fórmula (8) que se presenta a continuación se convierte en n 2 + n = n{n + 
l )/2 + n(n + l)/ 2 . 

Ejemplo 6 Si V es el espacio columna de A y W es el espacio columna de B, entonces V + W es el 
espacio columna de la matriz más grande [A B]. La dimensión de V + W puede ser me¬ 
nor que las dimensiones combinadas de V y W (porque estos dos espacios podrían trasla¬ 
parse): 

Suma de espacios columna dim(V + W) = rango de [A B]. ( 6 ) 



El cálculo de \ n W es más sutil. Para la intersección de espacios columna, un buen 
método consiste en poner bases de V y W en las columnas de A y B. El espacio nulo de [A 
fi] conduce aVnW (consulte el problema 9). Estos espacios tienen la misma dimensión 
(la nulidad de [A B]). Al combinar con dim(V + W) se obtiene 

dim(V + W) + dim(V n W) = rango de [ A B] + nulidad de [A B]. (7) 

Se sabe que el rango más la nulidad (contando las columnas pivote más las columnas li¬ 
bres) siempre es igual al número total de columnas. Cuando [A B ] tiene k + i columnas, 
con k — dim V y l = dim W, se llega a una conclusión clara: 

Dimensión fórmula dim(V + W) + dim(V fl W) = dim (Y)' + dim(.W). (8) 

Que no es una mala fórmula. El traslape de V y W es V fl W. 
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3. Producto cartesiano de dos espacios vectoriales 

Si Y tiene dimensión n y W tiene dimensión q , su producto cartesiano Y X W tiene dimen¬ 
sión n + q. 

DEFINICIÓN Y X W contiene a todas las parejas de vectores x = ( v, w). 

Al sumar (v, w) a (v", w*) en este espacio producto se obtiene (v + v*, w + w*), y al mul¬ 
tiplicar por c se obtiene ( cv , cid). Todas las operaciones en V X W se realizan componen¬ 
te por componente. 

Ejemplo 7 El producto cartesiano de R 2 y R 3 se parece bastante a R 3 . Un vector típico renR 2 x R 3 
es ((1, 2), (4, 6, 5)); un vector de R 2 y uno de R 3 . Esto se ve como (1, 2, 4, 6, 5) en R 5 . 

Los productos cartesianos están asociados de forma natural con las matrices en blo¬ 
que. De R 5 a R 5 se tienen matrices ordinarias de 5 por 5. En el espacio producto R 2 x R 3 , 
la forma natural de una matriz en bloque M de 5 por 5 es: 

M _ R 2 a R 2 R 3 a R 2 _ 2 por 2 2 por 3 _ A B 

1 R 2 a R J R 3 a R 3 3 por 2 3 por 3 C D 

El resultado de la multiplicación de una matriz por un vector es ( Av + Bw, Cv + Dw), lo 
cual no es muy fascinante. 


4. Producto tensorial de dos espacios vectoriales 

De alguna manera se quiere contar con un espacio producto cuya dimensión sea n multipli¬ 
cada por q. Los vectores en este “espacio tensorial” (que se denota por ®), se parecen 
a las matrices de n por q. Para el producto tensorial R 2 ® R 3 , los vectores se parecen a las 
matrices de 2 por 3. La dimensión de R 2 x R 3 es 5, pero la dimensión de R 2 ® R 3 es 6. 

Se empieza con v = (1, 2) y w = (4, 6, 5) en R 2 y R 3 . El producto cartesiano simple¬ 
mente los aproxima mutuamente como ( v , w). El producto tensorial combina a v y w en 
la matriz vw T de rango 1: 


Columna multiplicada 
por renglón 


V ® w = VW T 


‘ 1 ] [465 
_2J 


4 6 5 

8 12 10 


Todas las matrices especiales vvj T pertenecen al producto tensorial R 2 ® R 3 . El espacio 
producto es generado por estos vectores v ® w. Las combinaciones de las matrices de ran¬ 


go 1 proporcionan todas las matrices de 2 por 3, por lo que la dimensión de R 2 ® R 3 es 6. 
En términos abstractos: el producto tensorial V ® W se identifica con el espacio de trans¬ 
formaciones lineales que van de V aW. 

Si V es sólo una recta en R 2 y V es sólo una recta en R 3 , entonces V ® W es sólo una 
“recta en el espacio de matrices”. Ahora las dimensiones son 1X1 = 1. Todas las matri¬ 
ces vw T de rango 1 son múltiplos de una matriz. 

Bases del producía tensorial. Cuando V es R 2 y W es R 3 , se tiene una base estándar 
para todas las matrices de 2 por 3 (un espacio de seis dimensiones): 


Base 


1 0 0 ] [0 1 0 | [0 0 1 ] [0 0 0 ] fo 0 0 ] [0 0 0 ‘ 

o o oj t o 0 0^ [o 0 0J [1 0 OJ [o 1 OJ [o 0 1 ' 
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T . ^ »J con stmvó de forma natural. Se comenzó con la base estándar 

f p ” * 5 (0 P r? É..OS ««. se combinaron con los vector» bísmos 

1 be'íos ;.t v¿Js b¿ii Oas m.mees be 2 po, 3 de « <* P^»«o «nsona. 

V ® W. Esta construcción también tiene éxito para subespacios. 

Báse* Suponga que V y W son subespacios de IT y R p con bases v 2 , W*t- 
^ Enmíes las mLices de rango -1 «,«? constituyen una base para V ® W. 

=S=SSSSS‘ 

5 Producto de Kronecker A <8> B de dos matrices 

Una matriz A de m por » 

“ííEsta fs una transformación lineal (de productos tensoriales) 

y de ^ v :^rr?ia— 

2 de mp por nq. Este producto de Kronecker que también se denomma producto tensón ) 
se escribe 

a\\B a-nB 

Producto de Kronecker mp A%B = a ^ B a * B 
renglones, nq columnas 

Cl m 1 & G-mlB 

•Observe la estructura especial de esta matriz! Muchas matrices en bloque importantes> tie- 

donan algunos ejemplos). Si A y B son cuadradas, también lo son m nyp q, enton 
ces la matriz grande A® B también es cuadrada. 

Ejemplo 3 (nM» 

¿ ¿~*. - >. -«■*■*—■—- —■ 
das en la dirección y, uniendo cinco valores vecinos de u. 


Ui + l,j + — Ui-l,j 

Ui j+í + 2u¿,j — Ui¿— i 
= 0 




diferencias-* 


diferencias-y 


suma 
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Una ecuación de 5 puntos está centrada en cada uno de los nueve puntos de la malla. La 
matriz de 9 por 9 (que se denomina A 2D ) se construye a partir de la matriz “ID” de 3 por 
3 para las diferencias a lo largo de una recta: 


r 9 

Matriz de diferencias 

-1 

0' 

Matriz identidad * 

0 

0' 

en una dirección ^ — —1 

2 

-1 

en otra dirección ^ ~ ® 

i 

0 

0 

-1 

2 

L° 

0 

i 


Los productos de Kronecker producen tres diferencias ID a lo largo de tres rectas, ha¬ 
cia arriba o transversales: 


' 21 -I 0 ' 

Una dirección A® I = -I 21 -/. 

° -/ 21 

‘A 0 0' 

Otra dirección / ® A = 0 A 0 . 

. 0 0 A . 

"A+2/ -/ 0 

Ambas direcciones A 2D = (A ® I) + (I ® A) = -I A+21 -/ 

0 -/ A + 2/ _ 

La suma (A ® /) + (/ ® A) es la matriz de 9 por 9 de Laplace para la ecuación en dife¬ 
rencias de 5 puntos (en la sección 1.7 era para ID y en la sección 7.4 se mencionó a 2D). 
El renglón de en medio de esta matriz de 9 por 9 muestra todos los cinco elementos dife¬ 
rentes de cero para la molécula de 5 puntos: 

Lejos de la frontera Renglón 5 de A 2 d = [0 —10 —14—1 0—10]. 


Ejemplo 9 


(Matriz de Fourier en 2D) La matriz unidimensional F de Fourier es la matriz compleja 
más importante en el mundo. La Transformada Rápida de Fourier en la sección 3.5 es una 
forma rápida para multiplicar por esa matriz F. Así, la TRF transforma el “dominio tempo¬ 
ral en el dominio de frecuencias” para una señal de audio en ID. Para imágenes, se re¬ 
quiere la transformada 2D: 


Matriz de Fourier en 2D F 2 t> = F ® F 


Se transforma a lo largo de cada renglón, 
y luego hacia abajo de cada columna 


La imagen es un arreglo bidimensional de valores de pixeles. Es transformada por F 2D en 
un arreglo bidimensional de coeficientes de Fourier. Este arreglo puede comprimirse, trans¬ 
mitirse y almacenarse. Luego, la transformada inversa regresa de los coeficientes de Fou¬ 
rier a los valores de pixeles. Es necesario conocer la regla inversa para los productos de 
Kronecker: 

La inversa de la matriz A ® B es la matriz A ~ 1 ® B~ 1 . 


¡La TRF también acelera la transformada inversa 2D! Simplemente se invierte en una di¬ 
rección seguida de la otra dirección. Se está sumando ^ c u e ikx e ity sobre k y luego so¬ 
bre i. 

La matriz de diferencias de Laplace A 2 d = (A®/)+(/®A)no tiene una fórmu¬ 
la inversa sencilla. Es por ello que la ecuación A 2 dm = b ha sido estudiada con tanto cui¬ 
dado. Uno de los métodos más rápidos es diagonalizar A 2D usando la matriz de vectores 
característicos (que es la matriz seno S ® S de Fourier, muy semejante a A 2D ). Los valo¬ 
res característicos de A 2D provienen inmediatamente de los valores característicos de A 1D : 
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Los n 2 valores característicos de (A 0 I) + (/ <g> B ) son todas las sumas ¿.¡(A) + Xj(B). 
Los n 2 valores característicos de A 0 B son todos los productos A .¡(A)Xj(B). 

Si A y B son de n por n, el determinante de A 0 B (el producto de sus valores característi¬ 
cos) es (det A)”(det B) n . La traza de A 0 B es (traza A)(traza B). ¡En este apéndice se ilus¬ 
tran tanto el “álgebra lineal pura” como sus aplicaciones cruciales! 


BS Conjunto de problemas A 

1. Suponga que S y T son subespacios de R 13 , con dim S = 7 y dim T = 8 . 

a) ¿Cuál es la máxima dimensión posible de S D T? 

b ) ¿Cuál es la mínima dimensión posible de S íl T? 

c) ¿Cuál es la mínima dimensión posible de S + T? 

d) ¿Cuál es la máxima dimensión posible de S + T? 

2. ¿Cuáles son las intersecciones de las siguientes parejas de subespacios? 
á) El plano x-y y el plano z-y en R 3 . 

b ) La recta que pasa por (1, 1, 1) y el plano que pasa por (1, 0, 0) y (0, 1, 1). 

c) El vector cero y todo el espacio R 3 . 

d) El plano S perpendicular a (1, 1, 0) y (0, 1, 1) en R 3 . 

¿Cuáles son las sumas de estas parejas de subespacios? 

3. En el espacio de todas las matrices de 4 por 4, sea V el subespacio de las matrices 
tridiagonales y W el subespacio de las matrices triangulares superiores. Describa el 
subespacio V + W, cuyos elementos son las matrices superiores de Hessenberg. 
¿Cuál es V n W? Compruebe la fórmula (8). 

4. SiVnW contiene sólo al vector cero, entonces la ecuación (8) se convierte en dim(V 
+ W) = dim V + dim W. Compruebe este hecho cuando V es el espacio renglón de 
A, W es el espacio nulo de A y la matriz A es de m por n de rango r. ¿Cuáles son las 
dimensiones? 



5. Proporcione un ejemplo en R 3 para el que VnW contiene sólo al vector cero, pero V 
no es ortogonal a W. 

6. Si V fl W = {0}, entonces V + W se denomina suma directa de V y W, con la nota¬ 
ción especial V 0 W. Si V es generado por (1, 1, 1) y (1, 0, 1), escoja un subespacio 
W de modo que Y <g> W = R 3 . Explique por qué cualquier vector x en la suma direc¬ 
ta V 0 W puede escribirse de una y sólo una forma como x = v + w (con tienVy 
w en W). 

7. Encuentre una base para la suma V + W del espacio V generado por v¡ = (1,1, 0, 0), 
v 2 = (1,0, 1, 0) y el espacio W generado por w x = (0, 1, 0, 1), w 2 — (0, 0,1,1). Tam¬ 
bién encuentre la dimensión deVflWy una base para éste. 

8 . A partir de la ecuación ( 8 ), demuestre que rango (A + B) < rango(A) + rango(B). 

9. La intersección de C(A) n C(B) coincide con el espacio nulo de [A B\. Cada y = 
Ax¡ = Bx 2 en los espacios columna tanto de A como de B coinciden con x = (x x , —x 2 ) 
en el espacio nulo, porque [ A B]x = Ax¡ — Bx 2 = 0. Compruebe que y = (6, 3, 6) 



coincide con x — (1,1,—2, —3) y encuentre la intersección C(A) D C(B), para 


A = 

[á 

5 

0 

B = 

" 3 

0 

0 ' 

1 


2 

4 


0 

2 


10. Multiplique A 0 B por A 1 ® B 1 para obtener AA~* 0 BB~ l =101 = I 2D , 

11. ¿Cuál es la matriz de Fourier de 4 por 4 F 2 d = F 0 F para F = * * ? 

1 1 

12. Suponga que Ax = X(A)x y By = X(B)y. Forme un vector columna largo z con n 2 
componentes, x¡y , luego x 2 y y por último x„y. Demuestre que z es un vector caracte¬ 
rístico de (A ® I)z = X(A)z y (A ® B)z = X(A)X(B)z. 

13. ¿Cuál debe ser la matriz de Laplace de 7 puntos para —u xx — u yy — u zz =0? Esta 
matriz “tridimensional” se construye a partir de productos de Kronecker usando / y 
¿ lD . 



Apéndice 




La forma de Jordán 


Dada una matriz cuadrada A, se quiere escoger M de forma que M l AM sea lo más diago¬ 
nal posible. En el caso más sencillo, A tiene un conjunto completo de vectores caracte¬ 
rísticos que se convierten en las columnas de M, conocida como 5. La forma de Jordán es 

J = M . l AM = A; se construyó completamente a partir de bloques J, - X, de 1 por i, y el 

objeto de una matriz diagonal se ha alcanzado por completo. En el caso más general y di¬ 
fícil, faltan algunos vectores característicos y una forma diagonal es imposible. Ese caso 
constituye ahora nuestro principal interés. 

Se repite el teorema que debe demostrarse: 

Sí una matriz A tiene 5 vectores característicos linealmente independientes, entonces 
es semejante a una matriz J que es Informa de Jordán , con i bloques cuadrados en 

la diagonal: '.V. ir, AA-A 

'Jx 

J — M~ l AM = . 


Gada bloquei tiene un vector característico, un valor característico y unos justo arri¬ 
ba de la diagonal: ; ' . ..v; J,;-/ . 


Il I® 


mmmm 

. ....;■ -a": a-A■. - ■ ; 


Un ejemplo de esta forma de Jordán es el siguiente: 

‘8 1 0 0 0] [[8 ll 1 \ Jx 

0 8 0 0 0 [0 8 ] 

/ = 0 0 0 1 0 = i 0 1 - 1/2 

00000 L° 0 j 

o o o o oj L L ■ /3 -l 

El valor característico doble X = 8 sólo tiene un simple vector característico, en la prime¬ 
ra dirección de coordenadas e, = ( 1 . 0 , 0 , 0 , 0 ); como resultado, X - 8 solo aparece en un 
simple bloque J¡. El valor característico triple X = 0 tiene dos vectores característicos, e 3 
y e s , que corresponden a los dos bloques de Jordán J 2 y J 3 . Si A tuviese 5 vectores carac- 


tenslíeos, lüUUi> íu& * j - ^ . 

La pregunta clave es: Si A es alguna otra matriz de 5 por 5, ¿en que condiciones su 

forma de Jordán sería esta misma /? ¿Cuándo existe una M tal que M AM -J ! Gomo 
primer requerimiento, cualquier matriz semejante A debe compartir los mismos valores ca¬ 
racterísticos 8 , 8 , 0, 0, 0. Sin embargo, la matriz diagonal con estos valores característicos 
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no es semejante a J, y la pregunta planteada en realidad concierne a los vectores caracte¬ 
rísticos. 

Para contestar, M~ X AM — J se escribe en forma más simple como AM = MJ: 

lí 1 [8 i 

0 8 

A X\ x 2 x 3 x 4 x$ = Xy x 2 x 3 x 4 x s 0 1 

0 0 

J L J L 0 

Al efectuar la multiplicación columna por columna, 

Ax 1 = 8 xj y Ax 2 = 8 x 2 +x¡ (10) 

Ax 3 = 0x 3 y Ax 4 = 0x 4 + x 3 y Ax 5 = 0x 5 . (11) 

Ahora es posible reconocer las condiciones sobre A. Debe tener tres vectores característicos 
genuinos, así como J. El que cumple X = 8 debe ir en la primera columna de M, exactamen¬ 
te como si hubiese ido en la primera columna de S: Ax¡ = 8 x¡. Los otros dos, que se identi¬ 
fican como x 3 y x 5 , van en las columnas tercera y quinta de M: Ax 3 = Ax 5 = 0. Por último, 
debe haber otros dos vectores especiales: los vectores característicos generalizados x 2 y x 4 . 
Se considera que x 2 pertenece a una cadena de vectores, encabezados por x, y descrita por 

las ecuaciones (10). De hecho, x 2 es el único otro vector en la cadena, y el bloque /¡ corres¬ 

pondiente es de orden 2. La ecuación (11) describe dos cadenas distintas , una en la que x 4 si¬ 
gue a x 3 , y otra en la que x 5 está solo: los bloques J 2 y J 3 son de 2 por 2 y de 1 por 1 . 

La búsqueda de la forma de Jordán de A se convierte en la búsqueda de estas cade¬ 
nas de vectores, cada una encabezada por un vector característico: Para toda i, 

ya sea Ax¡ — X,x,- o bien, Ax¡ = X¡x¡ + x,-_i. (12) 

Los vectores x¿ van en las columnas de M, y cada cadena produce un simple bloque en J. 
Esencialmente, es necesario demostrar que estas cadenas pueden construirse para cada ma¬ 
triz A. Entonces, si las cadenas coinciden con las ecuaciones particulares (10) y (11), la J 
obtenida será la forma de Jordán de A. 

Considero que la idea de Filippov hace de la construcción lo más clara y sencilla po¬ 
sible.* Procede por inducción matemática, empezando con el hecho de que toda matriz de 
1 por 1 ya está en forma de Jordán. Puede suponerse que la construcción se logra para to¬ 
das las matrices de orden menor que n —esta es la “hipótesis de inducción”-— y luego ex¬ 
plicar los pasos para una matriz de orden n. Hay tres pasos, que después de una descrip¬ 
ción general se aplican a un ejemplo específico. 

Paso 1 Si se supone que A es singular, entonces su espacio columna tiene dimensión 
r < n. Observando sólo dentro de este espacio más pequeño, la hipótesis de inducción 
garantiza que una forma de Jordán es posible: en el espacio columna debe haber r vec¬ 
tores independientes w¡ tales que 

ya sea Aw¡ = X,u>,- o bien, Aw¡ = k¡w¡ +w¡-\. (13) 

Paso 2 Suponga que el espacio nulo y el espacio columna de A tienen una intersec¬ 
ción de dimensión p. Por supuesto, todo vector en el espacio nulo es un vector carac¬ 
terístico correspondiente a X = 0. Por consiguiente, en el paso 1 debe haber p cadenas 
que comenzaron en este valor característico, y se tiene interés en los vectores w¡ que 

* A. F. Filippov, A short proof of the reduction to Jordán form, Moscow Univ. Math. Bull., 
volume 26(1971) pp. 70-71. 




424 


Apéndice B La forma de Jordán 


vienen al final de estas cadenas. Cada uno de estos p vectores está en el espado co¬ 
lumna, por lo que cada uno es una combinación de las columnas de A. w¡ y, p 

Paso 3^* La dimensión del espacio nulo siempre es n - r. En consecuencia, de forma 

independiente con respecto a su intersección .^-dimensional con e J 

debe contener n-r-p vectores básicos adicionales afuera de esa mterseccion. 

A continuación se reúnen estos pasos para obtener el teorema de Jordán: 


Los r vectores ^ los p vectores y, y los „ - r - p vectores z, ^1 cadenas de 
Jordán para la matriz A, y estos vectores son hnealmente independientes. Van en 
columnas de M, y i = l AM está en forma de Jordán. 

Si se desea renumerar estos vectores como y hacerlos coincidir con la ecua¬ 

ción (12) entonces cada y, debe insertarse de inmediato después del w de\ que provino, 
c„"pS» n , cadena ení ,ne A, = 0. Las es vienen has.. «> final, cajún, so., en « 
oroDia cadena- de nuevo el valor característico es cero, ya que las zs están en el espac 
nulo Los bloques con valores característicos diferentes de cero ya se habían terminado en 
el paso 1 , los bloques con valores característicos cero aumentan por un renglón y un - 
lumna en el paso 2 y el paso 3 contribuye con cualesquiera bloques de 1 por 1 ¡ ]• 

A continuación se intentará trabajar un ejemplo, y a fin de permanecer próximo a las 
páginas previas, los valores característicos se toman como 8 , 8 , 0 , 0 , 0 . 


'8 0 0 8 8 ' 

0 0 0 8 8 

A = 0 0 0 0 0. 

0 0 0 0 0 

0 0 0 0 8 _ 

Paso 1 La dimensión del espacio columna es r = 3, y es generado por los veaores de 
coordenadas e>, e 2 , e 5 . Para buscar dentro del espacio se ignoran los renglones terce¬ 
ro y cuarto y las columnas de A, lo que queda tiene valores característicos 8 , 8 , 0 y su 
forma de Jordán proviene de los vectores 


r si roí [o 

o 1 8 

Wi = 0 , u>2 = 0 , W 3 = 0 . 

0 o o 

oj L 1 ] L°- 


Los ui, están en el espacio columna, completan la cadena para X - 8 e inician la ca¬ 
dena para X = 0: 


Awi = 8iüi, Aw 2 = 8u» 2 + w u Aw 3 - 0u, 3- ( 14 ) 

Paso 2 El espacio nulo de A contiene a * 2 y e 3 , por lo que su intersección con el espa¬ 
cio columna es generada por « 2 . Por consiguiente, p - 1 y, como era de esper 
ecuación (14) hay una cadena correspondiente a X = 0. El vector w 3 viene al fe () 
también al principio) de esa cadena, yiu 3 = A(e 4 - e x ). En consecuencia y 4 i- 
Paso 3 El ejemplo tiene n—r-p = 5-3-1-1, yz e 3 esta en e esp 
lo pero fuera del espacio columna. Es esta z la que produce un bloque de 1 por 1 en J. 

Si los cinco vectores se ensamblan, las cadenas completas son 


AiDt = 8 u>,, Aw 2 = %W2 + Wu Aw 3 = 0 u> 3 , Ay - 0y + w 3 , Az 0.. 
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Al comparar con las ecuaciones (10) y (11), se tiene una correspondencia perfecta: la for¬ 
ma de Jordán del ejemplo es exactamente la J que se escribió previamente. Al escribir los 
cinco vectores en las columnas de M debe obtenerse AAI = MJ, o bien, M~ l AM = J: 

'8 0 0 -1 0 ' 

0 18 0 0 

M = 0 0 0 0 1. 

0 0 0 1 0 

0 10 o o 

Confiamos bastante en las matemáticas (o somos demasiado flojos), por lo que no multi¬ 
plicamos M~ l AM. 

En la construcción de Filippov, la única cuestión técnica es comprobar la independen¬ 
cia de toda la colección w¡, y¡ y z¿. En consecuencia, se supone que alguna combinación es 
cero: 

X>tu, +'^2 l d i y¡ + Y.gg = 0. (15) 

Al multiplicar por A, y usar las ecuaciones (13) para las w¡, así como Az¡ = 0, 

f x ¡ w ¡ 1 ^ 

]T C/ o bien, + d l Ay¡ =0. (16) 

X¡w¡ + Wi-i 

Las Ay¡ son las w¡ especiales al final de las cadenas correspondientes a X¡ — 0, de modo que 
no pueden aparecer en la primera suma. (Están multiplicadas por cero en X¡w L ) Debido a 
que la ecuación (16) es alguna combinación de las w¡, que por la hipótesis de inducción eran 
independientes —proporcionaban la forma de Jordán en el espacio columna— se concluye 
que cada d¡ debe ser cero. Volviendo a la ecuación (15), esto deja c ¡ w ¡ = ~ J2 8¡Z¡ y el 
miembro izquierdo está en el espacio columna. Debido a que las zs eran independientes de 
ese espacio, cada g¡ debe ser cero. Por último, Y1 c ¡ u>¡ = 0 y la independencia de las w¡ 
produce c¡ = 0. 

Si la A original no hubiese sido singular, entonces los tres pasos se hubieran aplicado 
a A' = A — el. (La constante c se escoge para hacer singular a A', y puede ser cualquiera 
de los valores característicos de A.) El algoritmo pone A' en su forma de Jordán M~ l A'M 
= J' al producir las cadenas x¡ a partir de las w¡, y¡ y z¡. Luego, la forma de Jordán para A 
utiliza las mismas cadenas y la misma M: 

M~ l AM = M~ l A'M + M~ l cM = J' + el = J. 

Con esto se completa la demostración de que toda A es semejante a alguna matriz de Jor¬ 
dán J. Salvo un reagrupamiento de los bloques, es semejante sólo a una J así; hay una for¬ 
ma de Jordán única para A. Así, el conjunto de todas las matrices se separa en una canti¬ 
dad de familias con la siguiente propiedad: todas las matrices de la misma familia tienen 
la misma forma de Jordán, y todas son semejantes entre sí (y a J), pero ningunas matrices 
pertenecientes a familias distintas son semejantes. En cada familia, J es la más hermosa, 
en caso de que a usted le agrade que las matrices sean casi diagonales. Con esta clasifica¬ 
ción de familias terminamos. 


Ejemplo 1 


'0 1 2 
A = 0 0 1 

0 0 0 


con X = 0, 0, 0. 
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Esta matriz tiene rango r = 2 y sólo un vector característico. Dentro del espacio columna 
hay una sola cadena uq, w 2 que coincide con las dos últimas columnas: 


o bien, 

Au)j =0 y Aw 2 — 0 u >2 + w¡. 

El espacio nulo está completamente dentro del espacio columna, y es generado por w { . En 
consecuencia, p = 1 en el paso 2 , y el vector y proviene de la ecuación 

'2l [0' 

Ay = w 2 = 1 , cuya solución es y = 0 . 


cuya solución es 


Finalmente, la cadena w u w 2 , y va en la matriz M: 


'1 

2 

0 ' 

'0 

1 

0 ' 

M = 0 

1 

0 

, y M~ l AM = 0 

0 

1 

0 

0 

1 

L° 

0 

0 


Aplicación a du/dt = Au 

Como siempre, el problema se simplifica separando las incógnitas. Esta separación está 
completa sólo cuando hay un conjunto completo de valores característicos y u = Sv, el me¬ 
jor cambio de variables en este caso es n = Mv. Esto produce la nueva ecuación M dv/dt 
= AMv, o dv/dt — Jv, que es lo más simple como permiten las circunstancias. Está acopla¬ 
da sólo por los ls fuera de la diagonal dentro de cada bloque de Jordán. En el ejemplo pre¬ 
cedente, que tenía un solo bloque, du/dt = Au se convierte en 

d v " 0 1 0 da/ dt — b a = ao + bot + cot 2 / 2 

— = 0 0 1 v o bien, db/ dt = c o bien, b = bo + c 0 t 

0 0 0 dd dt =0 c — co. 

El sistema se resuelve trabajando hacia arriba a partir de la última ecuación, y en cada pa¬ 
so entra una nueva potencia de t. (Un bloque de l por í tiene potencias tan altas como 
Las exponenciales de J, en este caso y en el ejemplo anterior de 5 por 5, son 

"e 8í te s ‘ 0 0 0 ' 

'1 t t 1 / 2] 0 e Sl 0 0 0 

e Jt = 0 1 t y 0 0 1 t 0 . 

0 0 1 J 0 0 0 1 0 

[ 0 0 0 0 1 

Puede verse cómo los coeficientes de a, b y c aparecen en la primera exponencial. Y en el 
segundo ejemplo es posible identificar a todas las cinco de las “soluciones especiales” de 
du/dt = Au. Tres de ellas son las exponenciales puras «, = e 8 í xj, u 3 = e 0, X 3 y u¡ = 
e°’x¡, formadas como de costumbre a partir de los tres vectores característicos de A. Las 
otras dos implican los vectores característicos generalizados x 2 y x 4 : 

«2 = e s ‘(tx i + x 2 ) y w 4 = e 0, (tx 3 + x 4 ). (17) 
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La solución más general de du/dt = Au es una combinación de c¡ui + ■ ■ ■ + c¡u s , y la 
combinación que coincide con u 0 en el instante t = 0 de nuevo es 

«o = C 1 X 1 + • • • +C 5 X 5 , o bien u 0 = Me, o bien c = M~~ l u a . 

Esto sólo significa que u = Me J, M" l u 0 , y que la S y la A en la fórmula anterior Se At S~ l u 0 
se han sustituido por M y J. 


Conjunto de problemas B 

1. Encuentre las formas de Jordán (¡en tres pasos!) de 



B = 


'0 1 2 ' 

0 0 0 . 
0 0 0 


2. Demuestre que la solución especial u 2 en la ecuación (17) satisface du/dt = Au, exac¬ 
tamente debido a la cadena Ax 1 = 8 x 1 , Ax 2 = 8 x 2 + . 

3. Para la matriz B en el problema 1, use Me ]t M~ x para calcular la exponencial e 131 , y 
compárela con la serie de potencias I + Bt + ( Bt ) 2 / 2! + • • •. 

4. Demuestre que cada bloque de Jordán J¡ es semejante a su traspuesta, JT = P~ l J¡P, 
usando la matriz permutación P con ls a lo largo de la diagonal cruzada (de la parte 
inferior izquierda a la parte superior derecha). Concluya que toda matriz es semejante 
a su traspuesta. 

5. “Por inspección”, encuentre las formas de Jordán de 


A = 


1 2 3 
0 4 5 


0 0 6 



6 . Encuentre la forma de Jordán 7 y la matriz M para Ay B (Los valores característicos 
de B son 1, 1, 1, — 1). ¿Cuál es la solución de du/dt — Au, y cuál es e A,c > 


Suponga que A~ = A. Demuestre que su forma de Jordán 7 = M 1 AM satisface 
7 2 = 7. Ya que los bloques diagonales permanecen separados, esto significa que 
Jf = 7,- para cada bloque; demuestre por cálculo directo que J¡ sólo puede ser un blo¬ 
que de 1 por 1, J¡ = [0] o 7, = [1], Así, A es semejante a una matriz diagonal de Os y 
ls. 


Nota Este es un caso típico del teorema con que terminamos: la matriz A puede diagonali- 
zarse si y sólo si el producto (A — /)( A — X 2 /) • - • (A — X P I) , sin incluir ninguna repe¬ 

tición de los Xs, es cero. Un caso extremo es una matriz con valores característicos distintos; 
el teorema de Cayley-Hamilton establece que con n factores, A — XI siempre se obtiene ce¬ 
ro. El otro extremo es la matriz identidad, también diagonalizable (p = 1 y A — / = 0). La 
matriz no diagonalizable A = } j no satisface (A — /) = 0, sino sólo (A — / = O) 2 : una 

ecuación con una raíz repetida. 






1. Las rectas se cortan en (. x , y) = (3, 1). Así, 3(columna 1) + l(coluinna 2) = (4, 4). 

3, Estos “planos” se cortan en una recta en el espacio tetradimensional. El cuarto plano 
normalmente corta esta recta en un punto. Una ecuación inconsistente como u + w = 
5 no deja solución (no hay intersección). 

5. Los dos puntos sobre el plano son (1, 0, 0, 0) y (0, 1, 0, 0). 

7. Resoluble para (3, 5, 8 ) y (1, 2, 3); no resoluble para b = (3, 5, 7) o b = (1, 2, 2). 

9. Columna 3 = 2(columna 2) — columna 1. Si b = (0, 0, 0), entonces ( u , t), w ) = 
(c, — 2 c, c). 

11. Tanto a = 2 y a = —2 proporcionan una recta de soluciones. Todas las demás a pro¬ 
porcionan x = 0 , y — 0 . 

13. La representación de los renglones tiene dos rectas que se encuentran en (4, 2). La re¬ 
presentación de las columnas tiene 4(1, 1) + 2(—2, 1) = 4(columna 1) + 2(columna 
2 ) = miembro derecho de ( 0 , 6 ). 

15. La representación de los renglones muestra cuatro rectas. La representación de las co¬ 
lumnas está en el espacio fefradimensional. No hay solución a menos que el miembro 
derecho sea una combinación de las dos columnas. 

17. Si x, y, z satisfacen las dos primeras ecuaciones, también satisfacen la tercera ecuación. 
La recta L de soluciones contiene a v — (1, L 0), w = (j, 1, |) y u = + \w, 

así como a todas las combinaciones cv + dw con c + d = 1. 

19. Columna 3 = columna 1; soluciones (x, y, z) = (1, 1, 0) o (0, 1, 1) y es posible sumar 
cualquier múltiplo de (—1, 0, 1); b = (4, 6 , c) necesita c = 10 para resolubilidad. 

21. Se cambian el segundo plano, el renglón 2 y todas las columnas de la matriz. La solu¬ 
ción no cambia. 

23. u — 0, v = 0, w = 1, porque 1 (columna 3) = b. 

Conjunto de problemas 1.3, página 15 

1. Se multiplica por l = ™ = 5 y se resta para encontrar 2x + 3y = 1 y — 6 y = 6 . Los 

pivotes son 2 y —6 

3. Se resta —5 veces la ecuación 1 (o se suma \ veces la ecuación 1). La nueua segunda 
ecuación es 3 y = 3. Así, y — 1 y x = 5. Si el miembro derecho cambia de signo, tam¬ 
bién lo hace la solución: (x, y) = (—5, — 1). 

5. 6x + 4y es 2 veces 3x + 2y. No hay solución, a menos que el miembro derecho sea 

2 • 10 = 20. Por tanto, todos los puntos sobre la recta 3x + 2y = 10 son soluciones, 

incluyendo a (0, 5) y (4, —1), 

7. Sí a = 2, la eliminación debe fallar. Las ecuaciones no tienen solución. Si a — 0, la 
eliminación se detiene para un intercambio de renglones. Así, con 3 y = —3 se obtie¬ 
ne y = — 1 y con 4x + 6y = 6 se obtiene x — 3. 

9. 6x — Ay es 2 veces (3x — 2 y). Por consiguiente, se necesita b 2 = 2b x . Entonces hay una 
infinidad de soluciones. Las columnas (3, ó) y (—2, —4) están sobre la misma recta. 

11. 2x — 3y =3 pro- 2x — 3y = 3 x = 3 Del renglón 2 se resta 2 X renglón 1 

y + z = 1 por- y + z = 1 y y = 1 Del renglón 3 se resta 1 X renglón 1 

2y — 3z = 2 ciona — 5z = 0 z = 0 Del renglón 3 se resta 2 X renglón 2 
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13. La segunda posición pivote contiene a — 2 — b. Si b = —2, se intercambia con el ren¬ 
glón 3. Si b = — 1 (caso singular), entonces la segunda ecuación es — y — z = 0. Una 
solución es (1, 1, —1). 

15. Si renglón 1 = renglón 2, entonces el renglón 2 es cero después del primer paso; se 
intercambia el renglón cero con el renglón 3 y no hay tercer pivote. Si columna 1 = 
columna 2, no hay segundo pivote. 

17. El renglón 2 se convierte en 3y — 4z = 5; luego, el renglón 3 se convierte en (q + 

4)z = t — 5. Si q — —4, el sistema es singular; no hay tercer pivote. Luego, si t = 5, 

la tercera ecuación es 0 = 0. Al escoger z— 1, la ecuación 3y — 4z = 5 proporciona 
y — 3 y la ecuación 1 proporciona x = —9. 

19. El sistema es singular si el renglón 3 es una combinación de los renglones 1 y 2. Des¬ 
de la vista extrema, los tres planos forman un triángulo. Esto ocurre si los renglones 
1 + 2 = renglón 3 en el miembro izquierdo pero no en el miembro derecho; por ejem¬ 
plo, x + y + z — 0, x — 2y — z — l,2x — y = 9. Ninguna pareja de planos es para¬ 
lela, aunque sigue no habiendo solución. 

21. El quinto pivote es |. El n-ésimo pivote es íi±l>_ 

{ u + v + w — 2 u = 3 

2v + 2w = -2 Solución v = -2 . 

2w = 2 w = 1 

25. (u , v, w ) = (3/2, 1/2, —3). Se cambia a +1 para que el sistema sea singular (2 co¬ 
lumnas iguales). 

27. a = 0 requiere un intercambio de renglones, pero el sistema es no singular: a = 2 lo 
hace singular (un pivote, infinidad de soluciones); a = —2 lo hace singular (un pivo¬ 
te, no hay solución). 

29. El segundo término be + ad es (a + b)(c + d) — ac — bd (sólo una multiplica¬ 
ción adicional). 

31. La eliminación falla para a = 2 (columnas iguales), a = 4 (renglones iguales), a = 0 
(columna de ceros). 


Conjunto de problemas 1.4, página 26 

"171 [" 5] r2l 

1. 4 —2,- Con lados (2, 1) y (0, 3), el paralelogramo va a (2, 4). 

_ 17 J L 3 J 

3. Productos intemos 54 y 0, al multiplicar la columna por el renglón se obtiene 
"3 5 1" 

-6 -10 -2 . 

_ 21 35 7_ 

5. Ax = (0, 0, 0), de modo que x = (2, 1, 1) es una solución; las otras soluciones son 

"1 3 4" 

3 2 0, 

4 0 1 _ 

" 0 3 4" 

trica sesgada —3 0 0. 

-4 0 0_ 

9. a) a u b) ¿n — an/an c ) la nueva a, ; es a¡j - 

a n ° u 

tí) segundo pivote a 22 ~ — a\ 2 . 

a u 


'1 3 4" 

triangular 0 2 0, simé- 

0 0 7_ 


ex = (2c, c, c). 

7. Ejemplos: Diagonal 0 
0 


, simétrica 
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11. Los coeficientes del renglón B son 2, 1, 4 provenientes de A. El primer renglón de AB 
es [6 3]. 

o. a = :¡. 

15. ABi = B X A da 6 = c = 0. AB 2 = B 2 A da a — d. Así A = al. 

17. A(A + B) + B{A + B), {A + B)(B + A), A 2 + AB + BA + B 2 siempre es igual a 
(A + B) 2 . 

a b p q _ a [p q] + b [r s] = ap + br aq + bs 

c d r s c d cp + dr cq + ds 

21. A n = A; B" = q ’ c = o 0 = matriz cero - 

23. EyiE 2 \b = (1, —5, —35) pero E 2í E 32 b = (1, —5,0). Así, el renglón 3 no siente 
ningún efecto debido al renglón 1. 

25. Al cambiar tj 33 de 7 a 11 se cambia el tercer pivote de 5 a 9. Al cambiar a 33 de 7 a 2 
se cambia el pivote de 5 a ningún pivote. 

27. Para invertir E 3l , se suma 7 veces el renglón 1 al renglón 3. 

'1 0 0 

La matriz es R 3l = 0 1 0 . 

701 

'1 0 ll [1 0 1] [2 0 f 

29. £j 3 = 0 1 0; 0 1 0 ; £ 31 £i 3 = 0 1 0 . ¡Pruebe con la matriz identidad! 

0 0 110 1 10 1 


b) EB = 


31. £ 2 i tiene ¿ 2 ¡ = —j, £32 tiene ¿ 32 = — |, E43 tiene €43 = -f. En caso contrario, las 
Es coinciden con /. 

<2 + 6 + c = 4 a = 2 

33. a + 2b + 4c = 8 proporciona 6 = 1. 

a + 36 + 9c = 14 c = 1 

35. a) Cada columna es E multiplicado por una columna de B. 

6) EB=\ l °1 f 1 2 4 ] = í 1 2 4 1 

L 1 J J L 1 2 4 J i . 2 4 8 .' 

Los renglones de EB son combinaciones de los renglones de B, por lo que son múl¬ 
tiplos de [1 2 4]. 

37. (renglón 3) -xes JZ a 3 j x j> y (A z )n = (renglón 1 ) • (columna 1 ) = Yh a ij a ji- 
39. BA = 31 es de 5 por 5, AB — 51 es de 3 por 3, ABD = 5D es de 3 por 1, ABD: No, 
A(B + C): No 

0 0 f 

41. a) B = 4/. 6) B = 0. c) B = 0 1 0 . 

1 0 0 


41. a) B = 41. b) B =0. c) B 


d) Todo renglón de £ es 1,0, 0. 
43. a) mn (todo) 6) mnp. 

‘i] fo~ 

45. 2 [3 3 0]+ 4 [12 1] 

2 1 


c ) n 3 (esto es n 2 productos punto) 


'3 

3 

0' 

0 

0 

0' 

' 3 

3 

0' 

6 

6 

0 

+ 4 

8 

4 = 

10 

14 

4 

_6 

6 

0 

1 

2 

1 

7 

8 

1 
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47. A multiplicada f 1 -] f-1 1 f f_’ 

por B es J -J -J 5 - * 

49. Los bloques (2, 2) S = D — CA~' 1 B constituyen el complemento de Schur: los blo¬ 
ques en d — ( cb/a ). 

51. A multiplicada por X = [x t x 2 x 3 ] es la matriz identidad / = [Axi Ax 2 Ax{\. 

[a + 6 a + 6] . ., fo+c 6+¿] , , , 

53. , , , , coincide con , , , cuando 6 = c y a = d. 

c + d c + d J a + c b + d 

55. 2x + 3y + z + 5t = 8 es Ax = 6 con la matriz A = [2 3 1 5] de 1 por 4. Las so¬ 
luciones x llenan un “plano” tridimensional en cuatro dimensiones. 


'8 

3 

4 5 + u 

5 — u + v 

5 — v 

1 

5 

9 = 5 u — v 

5 

5 + u + v 

6 

7 

2j 5 + t 

5 + u — v 

5 — u 


57. El producto punto [1 4 5] y = (1 por 3)(3 por 1) es cero para puntos (x, y, z) so- 

_z_ 

bre un plano x + 4y + 5z = 0 en tres dimensiones. Las columnas de A son vectores 
unidimensionales. 

59. A * v = [3 4 5]' y v" * v = 50; v * A proporcionan un mensaje de error. 


61. M 


M 3 ( 1, 1, 1) = (15, 15, 15); A7 4 (l, 1, 1, 1) = (34, 34, 34, 34) porque la suma de los 
números 1 a 16 es 136, que es 4(34). 

Conjunto de problemas 1.5, página 39 

1. U es no singular cuando ningún elemento sobre la diagonal principal es cero. 

1 0 0][ 1 0 0] [1 0 0] [ 1 0 0][ 1 o o' 

3. 2 1 0 -2 1 0 = 0 1 0 ; -2 1 0 2 10=/ también. 

-I -1 lJL-1 1 1J [0 0 1J [-1 1 lj[-l -1 1_ 

(E~ l F~ l G~ l )(GFE) = E~ l F~ l FE = £T l £ = /; también (GF£)(£ _l £'“ 1 G“ 1 ) = I. 


'1 

0 

0' 

2 

3 

3' 

5 - LU = 0 

1 

0 

0 

5 

7 

3 

0 

1 

0 

0 

-1 


7- FGH 


10 0 0 
2 10 0 
0 2 10 
0 0 2 1 


; HGF 


después de la 
eliminación, 

'1 0 0 0 ' 

2 10 0 
4 2 10' 

8 4 2 1 


2 3 3 
0 5 7 
0 0-1 


v = 2 

w —1 


9. a) No singular cuando d^dj ¥> 0. b) Suponga que d 3 A 0. Le = 6 se resuelve ; 

0 di —di 0 u 

hacia abajo; Le = b proporciona c = 0 • Así, 0 d 2 —d 2 v = 


proporciona x 


11. Al resolver Le = 6 yendo hacia abajo se obtiene c 

5*1 

hacia arriba se obtiene x — — 2 . 

0 


-2 ; Al resolver Ux = c\ 
0 
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Permutación 
renglones 2 y 3 


Permutación 
renglones 1 y 2 


10 0 u 
0 0 1 , v 
0 10 w 

0 10 u 

1 0 0 , v 

0 0 0 w 


0 10 0 11 

15. PA = LDU es 10 0 10 1 

0 0 lj [2 3 4 

'1 0 01 [1 2 1 " 

PA = LDU es 0 0 1 2 4 2 

0 10 111 


1 0 0 ] [1 0 01 1 0 1 

0 1 0 0 1 0 0 1 1 

2 3 lj [0 0 -lj [o 0 1 

'1 0 0] [1 0 Oí [1 2 1' 
1 1 0 0 -1 0 0 1 0 

201 0 00 000 


17. L se convierte en 1 
2 


0 . MATLAB y otros códigos utilizan PA 
1 


19 . a = 4 conduce a un intercambio de renglones; 3b + 10 a = 40 conduce a una matriz 
singular; c = 0 conduce a un intercambio de renglones; c = 3 conduce a una ma¬ 
triz singular. 

21. i 3í = 1 y ¿ 32 = 2 (¿33 = 1): invierta los pasos para recuperar x + 3y + 6 z = 11 a 
partir de Ux — c; 1 multiplicado por (x + y + z = 5) + 2 multiplicado por (y + 2z = 
2) + 1 multiplicado por ( z — 2) proporciona x + 3y + 6 z = 11. 


23. 0 1 

0 -2 1 


1 

-2 1 
0 0 1 


1 1 1 
0 2 3 =U. 

0 0-6 


1 0 0 


A = 2 1 0 U = E 21 Ey¿ U = LU. 

0 2 1 


25. De 2 por 2; d — 0 no está permitido. 

"llO’ f 1 d e g 

1 1 2 = í 1 / h 

12 1 m n 1 i 

"2 4 8" 

27. A = 0 3 9 tiene L = I y D = 
0 0 7 


en la diagonal); A = LDU tiene U = D 1 A 


d = 1, e = 1, entonces £ = 
y = 0 no está permitido 
sin pivote en el renglón 2. 


3 ; A = LU tiene U = A (pivotes 

7_ 

"1 2 4" 

1=013 con unos en la diagonal. 
0 0 1 


a a a a 
a b b b 


1 

1 1 
1 1 1 
1 1 1 


b . Requiere c ^ 

- c d fe.. 
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1 110 

31. 1 1 11 

0 i ij [ 1 

(misma U) 


a a 0 

LIU; a a+b b 

0 b b + c 


(misma L) 


1 0 0 

33. 1 1 0 c : 

1 1 1_ 

A = LU. 


4 4 111 4 

5 proporcionac=1.0 1 1 x = 1 proporciona x ■ 

6 10 0 1“ 1 


35. La submatriz superior de 2 por 2 contiene los dos primeros pivotes 2 y 7; Razón: La 
eliminación sobre A comienza en la esquina superior izquierda con eliminación sobre B. 



"1 

1 

1 

1 

1 


1 

2 

3 

4 

5 

37. 

1 

3 

6 

10 

15 


1 

4 

10 

20 

35 


1 

5 

15 

35 

70 


’l 1 |"l 1 1 1 l"| El triángulo de Pascal en L y U. El có- 

1 1 1 2 3 4 digo lu de MATLAB arruina el patrón. 

= 12 1 1 3 6 . El código chol no realiza ningún inter- 

13 3 1 14 cambio de renglones para matrices si- 

1 4 6 4 1 1 métricas con pivotes positivos. 

39. Cada nuevo miembro derecho sólo cuesta n 2 pasos en comparación con los n 3 / 3 para 
eliminación total A\b. 

41. 2 intercambios; 3 intercambios; 50 intercambios y luego 51. 

0 10 ] |"1 0 0 ] [0 0 T 

43. p = 0 0 1 ; E, = 0 0 1 y P 2 = 0 1 0 

1 0 oj [01 OJ [l 0 0 

(P 2 proporciona un intercambio de columnas). 

45. Hay ni matrices permutación de orden n. Al final, dos potencias de P deben ser las 
mismas: Si P r = P 3 , entonces P r ~ s = I. Ciertamente, r — s < ni 


es 5 por 5 con P 2 


ro n F° 1 °1 

7 O .P 3 = 0 0 1 , y P 6 

t- 1 L 1 ° °. 


47. La solución es x = (1, 1, . .., 1). Así, x = Px. 


Conjunto de problemas 1.6, página 52 


0 3 L -1 
| Oj’^ 2 


?-A~ l 

1 > r*3 
2 . 


eos 9 sen 9 
-sen# eos 9 


3. A' 1 = BC~ l :A~ l = U 1 L " 1 P 
5. A(AB ) = (quitar paréntesis) = (A Z )(B) = I. 
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V3/2 1/2 -J3I2 1/2 0 1 todas tienen A 2 = /■ 

1/2 -V3/2j’L 1/2 V3/2J’ U OJ 

Si el renglón 3 de A" 1 fuese (a, b, c , d), entonces con A 'A = / se obtendría 2a - 0, 
fl + 3¿, = 0 4a + %b = 1. Esto no tiene solución. 

n oí' r-i oí . ro oi_ .. ri oí + ro oí ri oí 


4- A” 1 )- 1 = B(A + BT l A. 


t Í6 6 „ .t 2 

13. A T B = 8; B T A = 8; AB T = ^ 2 j; BA - 2 - 

Í5. a) n(n + l)/2 elementos sobre y arriba de la diagonal, b) (« - D»/ 2 elementos 

arriba de la diagonal. . , . f 

17 a) La inversa de una matriz triangular inferior (superior) sigue siendo triangular infe¬ 
rior (superior). Al multiplicar matrices triangulares inferiores (superiores) se obtie¬ 
ne una matriz triangular inferior (superior). b) Las diagonales principales e ^ 
r n y dmMT 1 son las mismas que las de D 2 y D x , respectivamente. L x L 2 Ü 2 - 
D U,UT l de modo que se tiene D x = D 2 . Al comparar los elementos fuera de 
la¿ diagonales de L^L 2 D 2 = D X U X U 2 \ ambas matrices deben ser diagonales. 
Lf l L 2 D 2 = D 2 , D x U x Uf l = Di. D l es invertible, de modo que L x L 2 1 , 


L x l L 2 D 2 = D 2 , D[u x Úf l = D\, Di es invertible, de modo que L x l L 2 /, 


/. Así, L x = Lr,,U x 


‘1 

0 

0" 

"1 

3 

5" 

0 

3 

0 

0 

1 

1 

0 

0 

2 

0 

0 

1 


1 0] \a 0 1 b/a _ LDL r 

b/a 1 |_° d ~ ^ 2 / a >J L° 1 

21. A partir de B(/ — AB) - (/ - BA)B se obtiene (/ - BA ) -1 = B V~* By \ B \ 
una inversa explícita en el supuesto de que B e / - AB sean invertibK*. / rutome- 
todo■ si / - AB no es invertible, entonces BAx = x para alguna x diferente de cero. E 
consecuencia, ABAx = Ax, o bien, ABy = y, z I ~ AB podría no ser invertible. (Ob¬ 
serve que y = Ax es diferente de cero, con base en BAx - x.) 

23 - y = - 0 . 2 ’ z = _ o.l] dem0d ° qUe A "‘ = ^ [- 2 1.' 

25 al En Ax = (1 0, 0), ecuación 1 + ecuación 2 - ecuación 3 es 0 = 1. b) Los 

miembros derechos deben satisfacer b x + b 2 = b 3 . c) El renglón 3 se convierte 

en un renglón de ceros; no hay tercer pivote. 

27. Si B intercambia los renglones 1 y 2 de A, entonces B intercambia las columnas 1 y 

2 de A ~~ 1 . * — i 

29. Si A tiene una columna de ceros, también BA. Así, BA = / es imposible. No existe A . 


b/a] = 


entonces 1 1 es L — E 

1 1 1. 

elementales y cambiar — 1 a +1. 


\ después de invertir el orden de estas tres matrices 
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33. A * ones(4,l) proporciona el vector cero, de modo que A no puede ser invertible. 


13 10' 

2 7 0 1 

13 10' 

3 8 0 1 


‘1 a b 1 0 0 

37. 0 1 c 0 1 0 

0 0 1 0 0 1 


13 10 

C 1 -2 1 


[/ A-»]; 


[/ A" 1 ]. 


1 a 0 1 0 —b 
0 1 0 0 1 -c 
0 0 1 0 0 1 


1 0 0 1 —aac — b 

0 10 0 1 -c 

0 0 1 0 0 1 


2201 20-11 
0 2 1 0 0 2 10 


1 0 - 1/2 1/2 

0 1 1/2 0 


[/ A” 1 ]. 


41. No es invertible para c — 1 (columnas iguales), c = 2 (renglones iguales), c = 0 (co¬ 
lumna cero). 


43. A" 1 = 


de ésta. 


110 0 
0 110 
0 0 11 
0 0 0 1 


. La matriz A 1 de 5 por 5 tiene ls en la diagonal y arriba 


/ 0] 

-C / j ’ - 


A* 1 

D _1 CA _1 


-D / 

I 0 ' 


47. Para Ax = b con A = ones(4, 4) = matriz singular y b = ones(4, 1), A\b, esco¬ 
ger = (1, 0, 0, 0) y pinv(A) * b escoge la solución más cortar = (1, 1, 1, 1)/4. 


4 ». a t =; a- - 


entonces A" 


-3 1/3 


, (A" 1 ) 1 = (A T )~ l 


'1 -3 

0 1/3 


; A T = A y 


2 e -1 


(A~') T = (A T )~ 1 . 


51. ((AB) _1 ) T == (B~* A -1 ) t = (A -l ) T (B -1 ) T ; (D _1 ) t es triangular inferior. 

53. a) x T Ay = a 2 2 = 5. b) x r A = [4 5 6]. c) Ay = ^ . 

55. ( Px) T (Py) = x r P r Py = x T y ya que P T P = /; por lo general, Px-y = x ■ P r y f 
x ■ Py: 

0 1 01 Til ["ll [Yl [0 1 0] [Y 

001 2 • 1 7 * 2 • 0 0 1 1 . 

1 0 °J L 3 J L 2 J L 3 J L 1 0 °J L 2 - 

57. PAP t recupera la simetría. 

59. a) La traspuesta de R T AP es r t a t R tt = R T AR — n por n. 

b) ( R r R)¡j = (columna j de R ) • (columna j de R) = longitud al cuadrado de la colum- 
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1 O 1 ^bc Jbc + jyss 

61. Las corrientes totales son A 1 y = -1 1 0 yes - ~ risc + yes • 

0 —1 —1 yBS_ yes — ^BS. 

De cualquier forma (Ax) T y = x T (A T y) = x B y B c + risyBS ~*cyBC +-«cycs — *sycs — 
JCs^bs- 

63. Ax ■ y es el costo de las entradas, mientras x • A T y es el valor de las salidas. 

65. Estos son grupos: triangular inferior con diagonal de unos, diagonal invertible D y las 
permutaciones P. Dos más: permutaciones pares; todas las matrices no singulares. 

67. Al reordenar los renglones y/o las columnas de ^ b d j se mueve el elemento a, con 
lo que no se obtiene c d j. 

69. Casi seguramente, las matrices aleatorias son invertibles. 

71. La matriz -1,2, -1 en la sección 1.7 tieneA = LDÜ con -£¡,¡-1 = 1 - 7 . 

Conjunto de problemas 1.7, página 63 

2 -1 

1 . -1 2 -1 
-1 2 - 
-1 

' 1 

_ 1 

= _2 
3 

1 -1 

-1 2 - 

3. A 0 = -1 


5. (u,, « 2 , « 3 ) = 

(tt 2 /8, 0, 

—jt 2 /8) en vez de los valores verdaderos (1,0, — 1) 

9 

-36 

30' 

7. = -36 

192 

-180 . 

30 

-180 

180 


9. La matriz de Hilbert de 10 por 10 está muy mal condicionada. 

11. Un pivote grande se multiplica por menos que 1 en la eliminación de cada elemento 
abajo del pivote. Un caso extremo, con multiplicadores = 1 y pivotes = I, i, 4, es 

" 1/2 1/2 1 
A = -1/2 0 1 . 

— 1/2 -1 1 _ 

Conjunto de problemas 2.1, página 73 

1. a) El conjunto de todas las (u, v ), donde u y v son razones p¡q de enteros, b) El con¬ 
junto de todas las (a, v), donde u = 0 o v = 0. 

3. C(A) es el eje x; N(A) es la recta que pasa por (1, 1); C(B) es R 2 ; N{B) es la recta que 
pasa por (—2, 1, 0); C(Q es el punto (0, 0) en R 2 ; el espacio nulo N(Q es R 3 . 
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5. Reglas que no se cumplen: a) 7, 8 , b) 1 c) 1, 2, 8 . 

7. b), d) y e) son subespacios. No es posible multiplicar por -1 en a) y c). No es posible 
sumar en f). 

9. La suma de dos matrices no singulares puede ser singular (A + (—A)). La suma de dos 
matrices singulares puede ser no singular. 

11. a) Una posibilidad: las matrices cA forman un subespacio que no contiene a B. 

b) Sí; el subespacio debe contener a A — B = I. 

c) El subespacio de matrices cuya diagonal principal es toda cero. 

13. Si (/ 4- g)(x) es la f(g(x )) de costumbre, entonces (g + /)(x) es g(f{x)), que es dife¬ 
rente. En la regla 2 ambos miembros son f(g(h(x))). La regla 4 se rompe porque po¬ 
dría no existir función inversa f~ 1 (x) tal que /(/ -1 (x)) = x. Si esta función inversa 
existe, se trata del vector —/. 

15. La suma de (4, 0, 0) y (0, 4, 0) no está sobre el plano; tiene x + y — 2z = 8 . 

17. a) Los subespacios de R 2 son R 2 mismo, las rectas que pasan por (0, 0) y el punto 
( 0 , 0 ). 

b) Los subespacios de R 4 son R 4 mismo, los planos tridimensionales n ■ v = 0, los 
subespacios bidimensionales (n t • v = 0 y n 2 • v = 0), las rectas unidimensionales 
que sólo pasan por (0, 0, 0, 0) y (0, 0, 0, 0). 

19. El menor subespacio que contiene aPyLesPoR 3 . 

21. El espacio columna de A es el eje x = todos los vectores (x, 0, 0). El espacio columna 
de B es el plano x-y — todos los vectores (x, y, 0). El espacio columna de C es la rec¬ 
ta de los vectores (x, 2 x, 0). 

23. Una combinación de las columnas de C también es una combinación de las columnas 
de A (mismo espacio columna; B tiene un espacio columna diferente). 

25. La columna adicional b agranda el espacio columna, a menos que b ya esté en ese es¬ 
pacio: 

_ fl 0 ll (espacio de columna más grande) 

1 J ~ 0 0 1 (no hay solución para Ax = b). 

10 ll incluida en el espacio de columna) 

0 1 1 (Ax = b tiene solución). 

27. Espacio columna = R 8 . Todo b es una combinación de las columnas, ya que Ax — b 
es resoluble. 

'1 1 2 ] [12 0 ' 

o bien 1 0 1 ; A = 2 4 0 (columnas en la línea 1). 

0 1 1J [3 6 0_ 

31. R 2 contiene vectores con dos componentes: no pertenecen a R 3 . 


1 1 0 
29. A = 1 0 0 
0 1 0 


Conjunto de problemas 2.2, página 85 

1. x+y+z = l,x+y + z= 0.Al cambiar 1 a 0, (x, y, z) —c(— 1, 1,0) +<¿( — 1,0, 1). 

f0 1 0 3l 

3. Forma escalonada U = _ _ . . ; variables libres x,, x 3 , x 4 ; soluciones espe- 

0 0 0 0 

cíales (1, 0, 0, 0), (0, 0, 1, 0) y (0, —3, 0, 1). Consistente cuando b 2 = 2 b x . Solución 
completa (0 ,b u 0, 0) más cualquier combinación de soluciones especiales. 
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Soluciones a ejercicios seleccionados 



11 1 1 *1 — * tiene espacio nulo = recta que pasa por ( 1 , 1 ), pero no tiene 

L 1 l \ W L°J 

solución. Cualquier b = C tiene muchas soluciones particulares de Ax p = b. 



17. Creo que es cierto. 

19. Las soluciones especiales son las columnas de M = 

21. Las r columnas pivote de A forman una submatriz de m por r de rango r, de modo que 
la matriz A* tiene r renglones pivote independientes, con lo cual se obtiene una sub¬ 
matriz invertible de r por r de A. (Los renglones pivote de A* y A son los mismos ya 
que la eliminación se efectúa en el mismo orden: simplemente para A no vemos las 
columnas “libres” de ceros que aparecen para A.) 

23. (uv T )(wz T ) = íí(u t u>)z t tiene rango 1, amenos que v T w = 0. 

25. Se tiene que AB = I, cuyo rango es n. Luego, rango(AB) < rango(A) obliga a que ran- 
go(A) = n. 

27. Si R = EA y la misma R = E*B, entonces B = (£•)" l EA. (Para obtener B, A se redu¬ 
ce a /? y luego se invierten los pasos de vuelta a B). B es una matriz invertible multi¬ 
plicada por A, cuando comparten la misma R. 

29. Debido a que R empieza con r renglones independientes, R~ empieza con r columnas 

independientes (y por tanto ceros). Así, su forma escalonada reducida es ^ q > don¬ 
de / es de r por r. 



Soluciones a ejercicios seleccionados 
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31. Si 


Si c l, R 


'112 2 

0 0 0 0 tiene x 2 , * 3 , x 4 libres. 

0 0 0 0 _ 

'l 0 2 2" 

0 10 0 tiene x 3 , x 4 libres. 

0 0 0 0 


Soluciones especiales en N 



-1 

-2 

-2 

r-2 

-2' 


1 

0 

0 

0 

0 


0 

1 

0 

(c = 1) y N = j 

0 


0 

0 

1 

_ 0 

1 


Si c = i, 1? = L q tiene x 1 
si c f 1 , 2 . 

Soluciones especiales en N — 
matriz vacía de 2 por 0 . 


tiene Xi libres; si c = 2, R = |q 
; n N = |J1 (c = 1) o bien, N = 


1 -2 

0 0 


= 1 o 

_ o 1 

tiene x 2 libres; R = I 
(c = 2) o bien, N = 


^completa 0 "i" X 2 1 J X com pi e ta 


35. a) Resoluble si b z — 2 b x y 3b 1 — 3 b 3 + b 4 — 0. Así, x = (no hay varia¬ 
bles libres), b) Resoluble si b 2 = 2 b¡ y 3 ¿>, — 3£> 3 + = o. 

5 bi — 2*3 —1 

Así, x = *3 —2*i 4-X 3 —1 . 


37. Un sistema de 1 por 3 tiene por lo menos dos variables libres. 

39. a) La solución particular x p siempre se multiplica por 1. b) Cualquier solución puede 


ser x p . c) 


3 3 x 
3 3 y 


= . Así, es más corta (longitud V2) que 


solución “homogénea” en el espacio nulo es x„ = 0 cuando A es invertible. 


41. x p se multiplica por 2 , misma x„; 


las soluciones especiales también in¬ 


cluyen a las columnas de 


; x p y las soluciones especiales no cambian. 


43. Para A, q = 3 proporciona rango 1, y cualquier otra q proporciona rango 2. Para B, 
q — 6 proporciona rango 1 , y cualquier otra q proporciona rango 2 . 

45. a) r < m, siempre r < n. b) r = m, r < n. c) r < m, r — n. d) r — m = n. 


10 0 0 

47. R = 0 0 1 0 

0 0 0 0 

renglón 3. 


1 0 0 
0 0 1 
0 0 0 


2 : no hay solución debido al 
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Soluciones a ejercicios seleccionados 


49_ a =. o -2 ; B no puede existir porque dos ecuaciones en tres incógnitas no pueden 
0 3_ 

tener una solución. 

51. El rango de A es 4 — 1 = 3; la solución completa de Ax = 0 es jc = (2, 3, 1, 0). 

'1 0 -2 0 ' 

r = o 1 -3 0 con-2,-3 en la columna libre. 

0 0 0 1 

53. a) Falso, b) Verdadero, c) Verdadero (sólo n columnas), d) Verdadero (sólo m 
renglones). 


55. U 


0 111111 ' 

0 0 0 1 1 1 1 

0 0 0 0 1 1 1 

0 0 0 0 0 0 0 


0 110 0 11 * 

0 0 0 1 0 1 1 (/? no proviene 

0 0 0 0 1 1 1 de esta U). 

0 0 0 0 0 0 0 


57. Si columna 1 = columna 5, entonces es una variable libre. Su solución especial es 

(- 1 , 0 , 0 , 0 , 1 ). 

59. Es seguro que la columna 5 no tiene pivote, ya que es una combinación de columnas 
anteriores y x s es libre. Con cuatro pivotes en las otras columnas, la solución especial 
es (1, 0, 1, 0, 1). El espacio nulo contiene a todos los múltiplos de (1, 0, 1, 0, 1) (una 
recta en R 5 ). 

*10 0 -4* 

61. A = 0 1 0 -3 . 

0 0 1 —2 

63. Esta construcción es imposible; dos columnas pivote, dos variables libres, sólo tres co¬ 
lumnas. 


67. Lo más probable es que R sea /; lo más probable es que R sea I con el cuarto renglón 
de ceros. 

69. Cualquier renglón cero aparece después de estos renglones: R = [1 -2 -3], 

„ 1*1 0 0*1 „ _ , 

R = „ , „ , R = I 
0 10 ’ 


Conjunta de problemas 2.3, página 98 
*i i ii h 

1. 0 1 1 c 2 = o proporciona c 3 = c 2 = c¡ = 0. Pero v, + v 2 - 4v 3 + v 4 - 0 

0 0 1 c 3 

(dependiente). 

3. Si a = 0, entonces columna 1 = 0; si d - 0, entonces ¿(columna 1) - a(columna 2) 
= 0 ; si / — 0 , entonces todas las columnas terminan en cero (todas son perpendicula¬ 
res a ( 0 , 0 , 1 ), y todas en el plano xy, deben ser dependientes). 




fACUlSTJ 



O 



*1 

2 3" 

£¡ng. FjEBE' 

<■%;. ¿'-3* 

5. a) 3 

1 2 

0 - 


2 

3 1 

0 - 

-1 -5 


' SólücioíTeS' 

*'"' ' " NACIONAL 

! al 
y' .¿y.-:?.:.'.- .23803 

URU ' Guav 


invertible => columnas independientes 
(hubieran podido usarse renglones). 


1 2 -3 

-3 1 2 

2 -3 1 


12-3] [1 

0 7 -7 ; A 1 

0 0 0 1 


0 ] la suma de las columnas 
0 , es 0 (hubieran podido 
0 usarse renglones). 


7. La suma v¡ — v 2 + u 3 = 0 porque (ui 2 — w 2 ) — (uq — w 2 ) + (uq — w 2 ) = 0. 

9. a) Los cuatro vectores son las columnas de una matriz A de 3 por 4 con por lo menos 
una variable libre, de modo que Ax = 0. b) Dependientes si el rango de [iq v 2 ] es 
0 o 1. c) Oui + c(0, 0, 0) =0 tiene una solución distinta de cero (tome cualquier 
rriO). 

11. a) Recta en R 3 . b) Plano en R 3 . c) Plano en R 3 . d) Todo R 3 . 

13. Todas las dimensiones son 2. Los espacios renglón de A y U son los mismos. 

15 . v = j(t) + w) 4- j(v — w) y w = j(t> + u;) — 5 ( 1 ; — w). Los dos pares generan 
el mismo espacio. Son una base cuando v y w son independientes. 

17 . Si la eliminación produce uno o más renglones cero, entonces los renglones de A son 
linealmente dependientes; 


por ejemplo, en el problema 16 


110 0 
10 10 
0 0 11 
0 10 1 


1 0 0 

-1 1 0 


1 0 0 

-1 1 0 


0 0 0 


19 . Los n vectores independientes generan un espacio de dimensión n. Forman una base 
para ese espacio. Si son las columnas de A, entonces m no es menor que n (m > n). 

21 . C(U): Bases cualesquiera de R 2 ; MU): (renglón 1 y renglón 2) o bien, (renglón 1 y 
renglón 1 + renglón 2 ). 

23. Columnas independientes => rango n. Las columnas generan R m => rango m. Las co¬ 
lumnas son una base para R m => rango = m = n. 

25. a) La única solución es x = 0 porque las columnas son independientes, b) Ar = b es 
resoluble porque las columnas generan R 5 . 

27. Las columnas 1 y 2 son bases para los espacios columna (diferentes) de A y U; los ren¬ 
glones 1 y 2 son bases para los espacios renglón (iguales); ( 1 , — 1 , 1 ) es una base pa¬ 
ra los espacios nulos (iguales). 

29. rango(A) = 2sic = 0yd=2; rango ( B ) = 2, excepto cuando c = d o c = —d. 

31. Sean v¡ = (1, 0, 0, 0), . . . , v 4 = (0, 0, 0, 1) los vectores de coordenadas. Si W es la 
recta que pasa por (1, 2, 3, 4), ninguno de los i>s está en W 

33. a) Si no hubiera una base, sería posible sumar más vectores independientes, con lo 
cual se excedería la dimensión k. b) Si no hubiera una base, sería posible elimi¬ 
nar algunos vectores, dejando menos que la dimensión k. 
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Soluciones a ejercicios seleccionados 


35. a) Falso, podría no haber solución, b) verdadero, 7 vectores en R 5 son dependientes. 


37. a) 


0 0 0 0 0 

0 0 , 010 , 
0 OJ [0 0 0_ 

oí r o i o' 

1 . c) -10 0 

OJ [ o o 0_ 

-a t . 

= 0 requiere A + B + C 


0 

0 ' 

"0 

0 

0 ' 

1 

0 , 

0 

0 

0 

0 

0 

0 

0 

1 


b) Sumar 


0 

1 

0' 

0 

0 

1 

1 

0 

o , 

0 

0 

0 , 

0 

0 

0 

1 

0 

0 


son una base para 
todas las 


39. y(0) — 0 requiere A + B + C = 0. Una base es eos x — eos 2x y eos x — eos 3x. 

41. y¡(x), y 2 (x), y 3 (x ) pueden ser x, 2x, 3x (dim 1) o bien, x, 2x, x 2 (dim 2), o bien, x, x 2 , x 3 
(dim 3). 


Compruebe el elemento (1, 1), luego (2, 3), luego (3, 3), luego (1,2) para demostrar 
que estos cinco Ps son independientes. Cuatro condiciones sobre los nueve elementos 
hacen que las sumas de renglones y columnas sean iguales: suma del renglón 1 = su¬ 
ma del renglón 2 = suma del renglón 3 = suma de la columna 1 = suma de la colum¬ 
na 2 (= suma de la columna 3 es automático porque suma de todos los renglones = 
suma de todas las columnas). 

45. Si la matriz [A b] de 5 por 5 es invertible, b no es una combinación de las columnas 
de A. Si [A ¿>] es singular y las columnas de A son independientes, b es una combina¬ 
ción de estas columnas. 


Conjunto de problemas 2.4, página 110 

1. Falso; lo único que se sabe es que las dimensiones son iguales. El espacio nulo izquier¬ 
do tiene una dimensión más pequeña dim = m — r. 

3. C(A): r = 2, (1, 0, 1) (0, 1,0); N(A ): n - r = 2, (2, -1, 1, 0), (-1, 0, 0, 1); 
C(A t ): r = 2, (1, 2, 0, 1), (0, 1, 1, 0); A(A T ): m - r = 1, (-1, 0, 1); 

C(U ): (1, 0, 0), (0, 1, 0); N(U): (2, -1, 1, 0), (-1, 0, 0, 0); 

C(U T ): (1, 2, 0, 1), (0, 1, 1, 0); N(A r ): (0, 0, 1). 

5. A multiplicada por cada columna de B es cero, de modo que C(B) está contenido en el 
espacio nulo N(A). 

7. Con base en Ax = 0, el espacio renglón y el espacio nulo deben ser ortogonales. Con¬ 
sulte el capítulo 3. 

'1 2 4 

9. [1 2 4]; 2 4 8 tiene el mismo espacio nulo. 

[3 6 12 

11. Si Ax = 0 tiene una solución diferente de cero, entonces r < n y C(A T ) es menor que 
R". Así, A J y = f no es resoluble para alguna/ Ejemplo: A = [1 1] y / = (1, 2). 

13. d = bc/a\ el único pivote es a. 

15. Con columnas independientes: rango n; espacio nulo = {0}; el espacio renglón es R"; 
inversa izquierda. 

17. A = (1 1 0]; B = [0 0 1]. 


Soluciones a ejercidos seleccionados 
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19. No: por ejemplo, todas las matrices invertibles de n por n tienen los mismos cuatro 
subespacios. 

'1 0 ' 

21. a) 1 0 . b) Imposible: dimensiones 1 + I # 3 c) [1 1], 


e) Imposible: espacio renglón = espacio columna requiere m = n. 


3 !} 6) ^ 

Así, m — r = n — r. 


23. A invertible: base del espacio renglón = base del espacio columna = (1, 0, 0), (0, 1, 0), 
(0, 0, 1); las bases del espacio nulo y del espacio nulo izquierdo son vacías. B: base 
del espacio renglón ( 1 , 0 , 0 , 1 , 0 , 0 ), ( 0 , 1 , 0 , 0 , 1 , 0 ) y ( 0 , 0 , 1 , 0 , 0 , 1 ); base del espa¬ 
cio columna ( 1 , 0 , 0 ), ( 0 , 1 , 0 ), ( 0 , 0 , 1 ); base del espacio nulo (— 1 , 0 , 0 , 1 , 0 , 0 ), ( 0 , 
— 1 , 0 , 0 , 1 , 0 ) y ( 0 , 0 , — 1 , 0 , 0 , 1 ); la base del espacio nulo izquierdo es vacía. 

25. a) El espacio renglón es igual al espacio nulo. En consecuencia, el rango (dimensión 
del espacio renglón) es el mismo, b) El espacio columna es igual al espacio nulo 
izquierdo. Mismo rango (dimensión del espacio columna). 

27. a) La inexistencia de una solución significa que r< m. Siempre se tiene r < n. No es 
posible comparar m y n. 

b) Si m — r > 0, el espacio nulo de A T contiene un vector diferente de cero. 

29. Base del espacio renglón (1, 2, 3, 4), (0, 1, 2, 3), (0, 0, 1, 2); base del espacio nulo 
( 0 , 1 , — 2 , 1 ); base del espacio columna ( 1 , 0 , 0 ), ( 0 , 1 , 0 ), ( 0 , 0 , 1 ); el espacio nulo iz¬ 
quierdo tiene una base vacía. 

31. Si At> = 0 y v es un renglón de A, entonces v ■ v = 0. Sólo v — 0 en ambos espacios. 

33. Renglón 3 — 2(renglón 2) + renglón 1 = renglón cero, de modo que los vectores c(l, 
—2, 1) están en el espacio nulo izquierdo. Ocurre que los mismos vectores están en el 
espacio nulo. 

35. a) u y w generan a C(A). bjiiyj generan a C(A T ). c) Rango < 2 si u y w son depen¬ 
dientes o v y z son dependientes, d) El rango de uv r + wz T es 2. 

37. a) Verdadero (mismo rango), b) Falso (A = [1 0]. c) Falso (A puede ser inver- 
tible y también no simétrica), d) Verdadero. 

39. Un = 1, Cl\2 ~ 0, Ct \3 — 1, £222 = &32 “ L &31 = 0, £223 = L ^33 — 0, ¿Í 21 — 1 

(no es única). 

41. Rango r — n significa espacio nulo = vector cero y x„ = 0. 


Conjunto de problemas 2.5, página 122 


'i -i o] rr 

1. A = 0 1 — 1 ; N(A) contiene múltiplos de 1 ; N(A T ) contiene múltiplos de 

l 0 -1J [i. 

f 
1 . 

-1 


3. La suma de los elementos en cada renglón es cero. Por tanto, cualquier combina¬ 
ción posee esa misma propiedad: / + f 2 + f 3 = 0; A T y = / =» y x + y 3 = /,, 
—y, + y 2 = / 2 , — y 2 — y 3 = / 3 fi + f 2 + h = 0- Significa que la corriente to¬ 
tal que entra desde el exterior es cero. 


Soluciones a ejercicios seleccionados 


c¡ + C3 

-c 1 
-C3 


-C\ 
Ci + c 2 
-C 2 


“C 3 
~~t'2 
C 2 + C 3 


Cj + C 3 
-C| 


-Cj 

C\ + C 2 


tiene pivotes c x + c 3 . 


C1C3 + c t c 2 + c 2 c 3 
c, +c 3 

Las condiciones sobre b son b\ + ¿4 — b¡ = 0, b 2 — ¿4 + £>6 = 0, b 2 — b 5 + be = 0. 


3 

-1 

-1 

~r 


C\ + c 2 + C¡ 

e 1 

~C 2 

-c s 

-1 

3 

-1 

-1 


-C\ 

C\ + C 3 + C 4 

-C 3 

-c 4 

-1 

-1 

3 

-1 

’ 

-C 2 

-C 3 

c 2 + c-¡ + ce 

-ce 

-1 

-1 

-1 

3 


—Cs 

-c 4 

-c 6 

ca + cs + ce 


; es que se unen con el nodo j ahora aparecen en el renglón j. 

0 0 0 -1 1 Oí [>1] Fo" 

i 0 0 -1 0 1 0 r- 

0 i 


I 0 
0 I 
o o 


o o 


o o 


1 o y x 

0 1 y 2 

1 0 y 3 

0 -1 y 4 

0 0 x¡ 


0 0 0 0 
-10 0 0 


13. Hay 20 elecciones de 3 aristas de 6, ya que “6 en 3” = 


20. Cuatro elecciones 


proporcionan triángulos, dejando 16 árboles generadores. 

15. Creo que ya está considerada. 

17. 9 nodos - 12 aristas + 4 ciclos = 1; 7 nodos — 12 aristas + 6 ciclos = 1. 

19. Con x = (1, 1, 1, 1) se obtiene Ax = 0; así, A T Ax = 0; de nuevo, el rango es n 


( M~)íj d¡id\j ~b * L cti n a n j 

y se obtiene a ik a kj — 1 cuando hay una ruta 
de 2 pasos que va de i a k a j. Observe las 
tres rutas que van de un nodo a sí mismo. 


Conjunto de problemas 2.6, página 133 


0 

-r 

0 

0‘ 

0 

Oj’ 

0 

0 


1. Rotación 


3. ||Ax ¡| 2 = 1 siempre produce una elipse. 

5. Son transformados a (1, 3), (2, 6 ), (—1, —3). El eje x gira; las rectas verticales se des¬ 
plazan hacia arriba o hacia abajo, pero permanecen verticales. 


Matriz de ° 2 0 

0 o o ^ 

segundas . El espacio nulo es generado por (1, 0, 0, 0) y (0, 1, 0, 0), 

derivadas ° ° ° ° 

o o o oj 

que proporcionan una P x lineal. Las segundas derivadas de funciones lineales son ce- 


Matriz de 
7. segundas 
derivadas 


Soluciones a ejercicios seleccionados 


segundas derivadas de cúbicas son lineales. 

9. e‘ y e~' son una base para las soluciones de u" 


11 . 

eos 9 

sen (9 

13. 

a) Sí. 

15. 

A = ' 


17. A 


10 0 0 
0 0 10 
0 10 0 
0 0 0 1 

0 0 0 ' 

1 0 0 . o 

o 1 o ,B 
o o 1 


y A 2 = 7; la doble traspuesta de una matriz 
proporciona la matriz misma. 

Observe que A 23 = 1 porque la traspuesta 
de la matriz 2 es la matriz 3. 


0 10 0 

;B = 0 0 1 0 ; AB = 

0 0 0 1 


0 0 0 
0 1 0 
0 0 1 
0 0 0 


[1 

0 

0 ' 

; BA = 0 

1 

0 

|o 

0 

1 


19. a) es invertible con T '(y) — y U3 : c) es invertible con T l (y) = y — 11. 

21. Con w = 0, la linealidad proporciona T(v + 0) = T(v) + 7X0). Así, 7X0) = 0. Con 
c — —1, la linealidad proporciona T(—0) = —T(0). Con certeza T(— 0) = 7X0). Así, 
7X0) = 0. 

23. S(T(v)) = S( v) = v. 

25. b) y c) son lineales, a) falla T(2v) = 2T(v), d) falla T(v + w) = T(v) + T(w). 

27. T(T(v)) = (v 3 ,v¡,v 2 ); T\v) = v; T 100 (v) = T(T"(v)) = T(v). 

29. a) 2X1, 0) = 0. b) (0, 0, 1) no está en el rango, c) 7X0, 1) = 0. 

31. La ley asociativa proporciona A(M X + M 2 ) = AM X + AM 2 ■ La ley distributiva aplica¬ 
da a las es proporciona A(cM) = c{AM. 

33. Con ninguna matriz se obtiene A ^ ® = q q • Para los profesores: la dimen¬ 

sión del espacio de matrices es 4. Las transformaciones lineales en ese espacio deben 
provenir de matrices de 4 por 4 (16 parámetros). Las multiplicaciones por A en los pro¬ 
blemas 31 y 32 son transformaciones especiales con sólo 4 parámetros. 

rts tí r\ n a ro bi 'TV n XT\. '-A. 11__1_ K /r r a 01 , , , . 


33. Con ninguna matriz se obtiene A 


35. T(I ) = 0 pero M ■■ 


37. a) M 


T(M); éstas llenan el rango. M ■ 


c) ad = be. 


en el núcleo. 


39. Reordenar la base con la matriz permutación ; cambiar las longitudes por medio de la 
matriz diagonal positiva. 

1 a a 2 A 4 

41. 1 b b 2 B = 5 ; el determinante de VanderMonde = (b — a)(c — a) 

1 c c 2 C 6 

(c — b); los puntos a, b y c deben ser distintos, y así el determinante # 0 (es posible 
interpolar). 

43. Si T no es invertible, entonces T(v 1 ), .... T(v n ) no es una base. Así, no es posible 
escoger w¡ = T(v¡) como base de salida. 

45. S(T(v)) = (-1, 2), pero S(v) = (-2, 1) y T(S(v )) = (1, -2). Así, TS A ST. 


Conjunto de problemas 3.1, página 148 
1 . ||x|| = Vil; 1 |y|| = 3V2; x T y = 0 . 

3 . (x 2 /x I )(y 2 /yi) = “1 significa que x t yi + x 2 y 2 = 0 , de modo que x T y = 0 . 

5. Dj y v 3 son ortogonales, así como v 2 y u 3 . 

7. x = (- 2 , 1 , 0 ); y = (- 1 , - 1 , 1 ); el renglón z = ( 1 , 2 , 1 ) es ortogonal al espacio nulo. 
9. El complemento ortogonal es la recta que pasa por (—1, — 1, 1) y (0, 0, 0). 

11. Si A T y = 0, entonces y l 'b = y T Ax = (y T A)x = 0, lo cual contradice que y r b A 0. 
13. La figura separa cualquier y en R m en la parte del espacio columna + la parte del es¬ 
pacio nulo izquierdo. '■ 

15. No puede existir una matriz así, ya que (1,2, 1) T (1, —2, 1) y 4 0. 

17. La matriz con la base para V como sus renglones. Así, el espacio nulo es V x = W. 
19. a) Si V y W son rectas en R 3 , V x y W x son planos que se cortan, b) V. 

21. (1,2, — 1) es perpendicular a P. A = J | ^ tiene ¿V(A) = P; B = [1 2 — 1] 

tiene espacio renglón = P. 


A ~ 2 2 tiene subespacios = cuatro rectas; (1, 1) ortogonal a (—1, 1). (L 2) or¬ 

togonal a (—2, 1). El espacio renglón siempre es perpendicular al espacio nulo L. 


25. a) 


no es ortogonal al. c) 1 en C(A) y 0 


en MA t ) es imposible: no son perpendiculares, d) A = j _. tiene A 2 — 0. 
e) ( 1 , 1 , 1 ) está en el espacio nulo y en el espacio renglón; no existe una matriz así. 

27. a) Si Ax = b tiene una solución y A T y = 0, entonces b r y = (Ax) T y =0. b) b no 
está en el espacio columna; así, no es perpendicular a ninguna y en el espacio nulo 
izquierdo. 

29. x = x r + x n , donde x r está en el espacio renglón y x n está en el espacio nulo. Así, 
Ax n = 0 y Ax = Ax r + Ax n — Ax r . Todos los vectores Ax son combinaciones de 
las columnas de A. Si x = (1, 0), entonces x r = (l/2, l/2). 


31. a) Para una matriz simétrica, el espacio columna y el espacio renglón son iguales, 
b) x está en el espacio nulo y z está en ei espacio columna = espacio renglón; por tan¬ 
to, estos “vectores característicos” tienen x T z = 0 . 


33. x se separa en x r + x„ = (1, —1) +(1,1) = (2, 0). 


35. Ax = Bx significa que [A B ] _í j = 0. Tres ecuaciones homogéneas en cuatro 

incógnitas siempre tienen una solución diferente de cero. Aquí x = (3, 1) y x = (1,0), 
y Ax = Bx — (5, 6 , 5) están en ambos espacios columna. ¡Dos planos en R 3 (que 
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37. A T y = 0 proporciona (Ax) T y = x T A T y = 0. Así, y _LAx y ¿V(A T ) _L C(A). 

1 3 l" 

39. S x es el espacio nulo de A = En consecuencia, S x es un subespacio in¬ 
cluso si S no lo es. t - 

41. Si V es todo R 4 , entonces V x sólo contiene al vector cero. Así, (V x ) x = R 4 = y. 
43. (1, 1,1,1) es una base de P x . El espacio nulo de A = [1 1 1 1] es el plano P. 

45. La columna 1 de A 1 es ortogonal al espacio generado por los renglones 2o.. 

n-ésimo de A. 

2 2-1 

47. A = -1 2 2 , 

2 -1 2 j 

A t A = 91 es diagonal : (Á l A)¡ j = (columna i de A) • (columna j). 

49. a) (1, — 1, 0) está en ambos planos. Los vectores normales son perpendiculares, ¡y los 
planos siguen cortándose! b) Se requieren tres vectores ortogonales para generar 
todo el complemento ortogonal en R 5 . c) Las rectas pueden cortarse sin ser orto¬ 
gonales. 

51. Cuando AB = 0, el espacio columna de B está contenido en el espacio nulo de A. En 
consecuencia, dimensión de C(B) < dimensión de N(A). Esto quiere decir rango 
( B ) < 4 — rango(A). 


Conjunto de problemas 3.2, página 157 

1 . a) (x + y )/2 > Jxy (media aritmética > media geométrica de x y y). 

b) l|x+y |¡ 2 < (||x|| + ||y ||) 2 significa que (x +y) T (x +y) < ||x || 2 +2||x||||y||-H|y|| 2 . 
El miembro izquierdo es x T x + 2x T y + y T y. Después de cancelar lo anterior, se 
obtiene x T y < ||x||||y||. 

3. p = (10/3, 10/3, 10/3); (5/9, 10/9, 10/9). 

T 

5. eos9 = 1/Vñ, de modo que 9 = arccos(l/Vñ); P = : [1 /n ■■■ 1/n] = 

1 1 

todos los elementos — . 


7. Se escoge b = (1,. .., 1); la igualdad ocurre si a l 
la a b). 

y p 2 _ aa T aa T _ a(a T a)a r _ aa T _ 

a T aa r a (a T a)(a T a) a T a ^ 


11. a) P = “ | ; 

.10 10 . 


a n (entonces a es parale- 


b) P l + P 2 


f0 01 

Pi Pi ~ q q • La suma de las proyecciones sobre dos rectas perpendiculares 

proporciona el vector mismo. La proyección sobre una recta y luego una recta per¬ 
pendicular proporcionan el vector cero. 


13. Traza = fÜÜÜ + .. - + füfí 

a nT n 
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15. ||Ax|| 2 = ( Axf(Ax ) = xA t Ax, ||A t x|| 2 = (A T ;t) T (A t jc) = x4A t jc. Si A t A = AA T , en¬ 
tonces ||Ax|| = )|A T x|j. (Estas matrices se denominan normales). 

17. a) a J b/a T a = 5/3; p = (5/3, 5/3, 5/3); e = (-2/3, 1/3, 1/3) tiene e T a = 0. 
b) a T b/a T a = —1; p = (1, 3, 1) = b y e — (0, 0, 0). 


1 1 1 

1 1 1 = Pf y P\b 

1 1 1 


5 

5 ,P 2 


1 3 1 

3 9 3 y 
1 3 1 


1 1 -2 -2 

21- P\ — ~ ~2 4 4 , P 2 = - 

y [-2 4 4J y 

P¡P 2 — matriz cero porque a¡ J_ a 2 . 
23. P x +P 2 + P 3 


4 -2 


-2 4 

1 - 2 = 1 . 


I " 2 4 4j ’ 1-2 -2 lj * [ 4 -2 4J 

25. Debido a que A es invertible, P = A(A T A) _ 1 A T = AA-'(A T ) - 1 A T = /: proyectar 
sobre todo R 2 . 

Conjunto de problemas 3.3, página 170 

1. x = 2; E 2 = (10 — 3x) 2 + (5 - 4x) 2 es minimizado; (4, -3) T (3, 4) = 0. 


] ; p = 5 ;b - p 


_ 2 
3 


es perpendicular a ambas columnas. 


5. ¿ = 4, 5, 9 en í = — 1, 0, 1; la mejor recta es 6 + (5/2)f; p = (7/2, 6 , 17/2). 

' 1 1/2 0 

7. P = A(A T A) _1 A T = 1/2 1/2 -1/2 . 

_ 0 - 1/2 1 

9. a) p T = (P T P) T = p. Así, P = p T p = p 2 , b) P proyecta sobre el espacio 
Z = {0}. 

11. P + Q = 1,PQ=Q, trasponer a QP = 0, de modo que (P — g)(P — Q) — P ~ 
0-0 + Q= I. 

13. La mejor recta es 61/35 - (36/35)í; p = (133/35, 95/35, 61/35, -11/35) a partir 
de C = Dt. 

15. H 2 = (/ — 2P) Z = / — 4P + 4P 2 = / — 4P + 4P = /. Con dos reflexiones se 
obtiene I. 

1*7 T o rn'Airor'r'inin rAKra -v —1— ■»> ——• A —— ertKrí» ( 1 1 ) — í 1/2 j 


17. La proyección sobre x + y = 0 = Proyección sobre ( — 1 , 1) 


- 1/2 1/2 


19. La matriz proyección sobre el espacio renglón debería ser A T ( A A T ) 1 A si los renglo¬ 
nes fuesen independientes. 
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3. Proyección sobre ay. (-2/3, l/3, -2/3); la suma es b mismo; observe que a 2 aj, 
a 3 aj son proyecciones sobre tres direcciones ortogonales. Su suma es la proyección 
sobre todo el espacio y debe ser la identidad. 

r i _ i i ii 

2 2 2 2 

-lili 

5. (I —2uu t ) t (I — 2 uu t ) = I — 4«m t + 4uu r uu r = I',Q = , , i _i’ 

2 2 2 2 

1 1 _i I 

. 2 2 2 2 J 

7 . (x x q x +■■■+ x nqn f{x xqi + ■■■+ x n q n ) = xf + ■ ■ ■ +xl => llbll 2 = = 

xj + • • • + x\. 

9. La combinación más próxima de q 3 es 0q x + 0q 2 . 

11. O es triangular superior; la columna 1 tiene q n = ± 1; por ortogonalidad, la columna 
2 debe ser (0, ± 1, 0,...); por ortogonalidad la columa 3 es (0, 0, ± 1,...); y asi su¬ 
cesivamente. 



19. C* - {q¡C*) íz es c - (qjc) <?, ~ (qjc) q 2 porque q¡q x = 0. 

21. Por ortogonalidad, las funciones más próximas son 0 sen 2x = 0 y 0 + Ox = 0. 

23. a 0 = 1/2, a x = 0, b x = 2/n. 

25. La recta más próxima es y = 1/3 (horizontal, ya que ( x , x 2 ) = 0). 

27. (1/V2, — 1 /a/2, 0,0), (1 A/6, 1/a/6 í 2/a/6,0), 

(— 1/2 a/3, — 1/2a/3, 1/2a/3, -1/V3). 

29. A =a =(1, -1,0,0);5 =b—p = ( 5 , 5 » “A0) ;C =c-p A ~PB = ( 5 * 5 » I- _1 )- 
Observe el patrón en estos vectores ortogonales A,ByC. Luego, (1, 1, 1, l)/ 4 - 

31. a) Verdadero b) Verdadero, gx = xi^i + x 2 q 2 . llgxli 2 = x\ +x\ porque qjq 2 — 0. 


Conjunto de problemas 3.5, página 196 


■4 

0 

0 

0' 


'16 

0 

0 

0' 

0 

0 

0 

4 

174 — 

0 

16 

0 

0 

0 

0 

4 

0 

, jT — 

0 

0 

16 

0 

0 

4 

0 

0 


0 

0 

0 

16 


3. La submatriz es F 3 . 

5. = -1 para x = (2k + l)jr, e w = 1 para 0 = + n¡ 2, *es entero. 
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S * í 


7. c = (1, 0, 1, 0). 

9. a ) y = F veces (1, 0, 0, 0) = columna cero de F = (1, 1, 1, 1). 
b) c = (1, 1, 1, l)/4. 


13. c 0 = (/o + /i+/2+/3)/4,c, =(/o-í7,-/ 2 +i/3)/4,c 2 =(/o-/i+/2-/ 3 )/4, 
c 2 = (,fo+if\ -/ 2 -i/3)/4;/impar significa/o = 0, f 2 = 0, / 3 = -/. Luego c 0 = 0, 
c 2 = 0, c 3 = —c 1 de modo que c también es impar. 


'1 


1 

1 

1 

2 

1 




"1 


'1 

1 

1 

17. D = 

g2ni/6 

y F 3 = 

1 

g2rti/3 

g4ir¡/3 


e 4rzi/6 

1 

e 4>r ‘/ 3 

g2xi/3 


"0 1 0' 

19. A = diag(l, i, i 2 , i 3 ); P = 0 0 1 y P T lleva a X 3 — 1 =0. 

i 0 0 

21. Valores característicos e 0 = 2 — 1 — 1 =0, e\ — 2 — i — i 3 = 2, e 2 = 2 — ( — 1) — 
( —1) = 4, e 3 = 2 — ¿ 3 — i 9 — 2 Compruebe traza 0 + 2 + 44-2 = 8 . 

23. Las cuatro componentes son (co + C2) + (c t + C3); luego, (co — c 2 ) + i(c¡ — c 3 ); 
luego, (c 0 + c 2 ) — (ci + c 3 ); luego, (cq — c 2 ) — i(c\ — c 3 ). ¡Estos pasos son la TFR! 

Conjunto de problemas 4.2, página 206 

1. det(2A) = 8 y det(—A) = (—l) 4 det A = | y det(A 2 ) = | y det(A -1 ) = 2. 

3. Por la regla 5, las operaciones en los renglones dejan sin modificar a det A. Luego, al 
multiplicar un renglón por — 1 (regla 3) se obtiene la regla del intercambio de renglo¬ 
nes: det B = —det A. 

5. Para la primera matriz, con dos intercambios de renglones se obtiene la matriz identi¬ 
dad. La segunda matriz requiere tres intercambios de renglones para llegar a I. 

7. det A = 0 (singular); det U = 16; det U T = 16; det C/ -1 = 1/16; det M = 16 (dos in¬ 
tercambios). 

9. El nuevo determinante es (1 — mí)(ad — be). 

11. Si |det ¡2| no es 1, entonces det Q" = (det Q) n se inflaría o tendería a cero. Pero Q" si¬ 
gue siendo una matriz ortogonal. Así, det Q debe ser 1 o — 1. 

13. a) Con la regla 3 (factorizar — 1 de cada renglón) se obtiene det ( K r ) = ( — l) 3 det K. 
Así, con —det K = det K T = det K se obtiene det K = 0. 


0 0 1 
0 1 o 
-10 0 
0 0 0 


tiene det 


b) 
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15. Sumar cada columna de A a la primera columna la hace una columna cero, de modo 
que det A = 0. Si la suma de todo renglón de A es 1, entonces la suma de todo renglón 
de A — / es cero y det (A — I) = 0. 

"1 i" 

Sin embargo, det A no debe ser 1: A = ] ] tiene det (A — I) = 0, aunque det 

A = 0^1. U 2. 

17. det (A) = 10, det (A" 1 ) = det (A - AJ) = A. 2 - 7X + 10 = 0 para X = 5 y 

A. = 2. 

19. Al tomar determinantes se obtiene (det C)(det D) = (-l)"(det D)(det C). Paran par 
el razonamiento fracasa (porque (-1)" = +1) y la conclusión es errónea. 
d —b 

21. det(A _1 ) = det ad Z bc ad ~ bc 

.ad — be ad — be 
23. Determinante = 36 y determinante = 5. 

25. det(L) = 1, det (i/) = - 6 , det (A) = - 6 , det(l/- 1 í, _1 ) = -g,y 
det (U~ l L- l A) = 1. 

27. Renglón 3 — renglón 2 = renglón 2 — renglón 1, de modo que A es singular. 

29. A es rectangular, de modo que det(A T A) f (det A T )(det A): éstas no están definidas. 

31. Los determinantes de Hilbert son 1, 8 X 10~ 2 , 4.6 X 10 -4 , 1.6 X 10 7 , 3.7 X 10 12 , 
5.4 X 10 -18 , 4.8 X 10 -25 , 2.7 X 10~ 33 , 9.7 X 10 -43 , 2.2 X 10 -53 . Los pivotes son ra¬ 
zones de determinantes, así que el décimo pivote está próximo a 10 - 53 / 10~ 43 = 10 ~ 10 : 
demasiado pequeño. 

33. Los determinantes más grandes de las matrices 0-1 para n = 1, 2, .... son 1, 1, 2, 3, 
5 , 9 , 32, 56, 144, 320, en la página web www.mathworld.wolfram.com/Hadamards- 
MaximumDeterminantProblem.htm/y también en la “On—Line Encyclopedia of Inte- 
ger Sequences”; www .research.att.com. Con — ls y ls, el determinante de 4 por 4 más 
grande es 16 (consulte Hadamard en el índice). 

35. det(7 + A7) = 1+a+b+c+d. Reste el renglón 4 de los renglones 1, 2 y 3. 
Luego, reste «(renglón 1) + ¿(renglón 2) + «(renglón 3) del renglón 4. Al hacer lo an¬ 
terior, se queda con una matriz triangular con 1, 1, 1, y 1 + a + b + c + d en su dia¬ 
gonal. 

Conjunto de problemas 4.3, página 215 

1. a) «i 2 « 2 i« 34«43 = 1; par, de modo que det A = 1. 

b) ¿i 3 ¿ 22 ¿ 3 i¿i 4 = 18; impar, de modo que det B = —18. 

3. a) Verdadero (regla del producto), b) Falso (todo ls). 

c) Falso (det [1 1 0; 0 1 1; 1 0 1] =2). 

5. El cofactor 1, 1, es F„_j. El cofactor 1, 2 tiene un 1 en la columna 1, con cofactor 
F„_ 2 . Multiplique por (-1) 1+2 y también -1 para encontrar F„ — F n -i+ F„_ 2 - Así, 
los determinantes son números de Fibonacci, excepto que F„ es el F„_ x de costumbre. 

7. Desarrollo por cofactores: det = 4(3) —4(1) + 4(—4) —4(1) = —12. 


ad — be _ 1 

{ad — be) 2 ad — be 
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13. det A = 1 + 18 -I- 12 — 9 — 4 — 6 = 12, de modo que los renglones son indepen¬ 
dientes; det B = 0, por lo que los renglones son dependientes (renglón 1 + renglón 
2 = renglón 3); det C — — 1, C tiene renglones independientes. 

15. Cada uno de los seis términos en det A es cero; el rango es cuando mucho 2; la colum¬ 
na 2 carece de pivote. 

17. «n a 23 « 32 a 44 tiene —, «i 4 a 23 % 2 « 4 i tiene +, de modo que det A = 0; 
det S = 2 • 4 • 4 • 2 - 1 • 4 ■ 4 ■ 1 = 48. 

19. a) Si a u = «22 = a 33 — 0> entonces es seguro que cuatro términos son cero, 
b) Quince términos son cero. 

21. ¡Algún término a la a 2/ ¡ • • • a nu en la gran fórmula es diferente de cero! Mueva los ren¬ 
glones 1,2 , ,n hacia los renglones /3, ... ,cü. Por tanto, estas as distintas de cero 
están sobre la diagonal principal. 

23. 4!/2 = 12 permutaciones pares; det (I + P par ) = 16 o 4 o 0 (16 proviene de I + I). 

3 2 1] [4 0 0] 

25. C = 2 4 2 y AC T = 0 4 0 = 47. En consecuencia, A~* = -C T 

_! 2 3j [0 0 4j 4 

27. |£„| = |A„| - ¡A„_,| = (n + 1) - n = 1. 

29. Es necesario escoger ls de las columnas 2 y 1, de las columnas 4 y 3 y así sucesiva¬ 
mente. En consecuencia, n debe ser par a fin de tener det A n ¥= 0. El número de inter¬ 
cambios es por lo que C„ = (— l) n/2 . 

31. S x = 3, S 2 — 8, S 3 = 21. Parece que la regla es que cada segundo número en la suce¬ 
sión de Fibonacci.. . , 3, 5, 8, 13, 21, 34, 55, . .. , por lo que la conjetura es S 4 = 55. 
Los cinco términos diferentes de cero en la gran fórmula para S 4 son (con números 3 
donde el problema 39 tiene números 2) 81 + 1—9 — 9 — 9 = 55. 

33. Al cambiar 3 por 2 en el vértice el determinante F 2n+2 se reduce por 1 multiplicado 
por el cofactor de ese elemento del vértice. Este cofactor es el determinante de 
(un tamaño menor), que es F^. En consecuencia, al cambiar 3 por 2 se modifica el de¬ 
terminante a F 2n4 . 2 — F 2n , que es F 2 „ +I . 

35. a) Todo det L = 1; det U k = det A* = 2, 6, -6 para k = 1, 2, 3. 
b) Pivotes 5, |, g. 

37. Los seis términos son correctos. Renglón 1 - 2 renglón 2 + renglón 3 = 0, de modo 
que la matriz es singular. 

39. Los cinco términos diferentes de cero en det A = 5 son 

( 2 )( 2 )( 2 )( 2 ) + (— 1 )( —!)( — !)( — 1 ) - ( — 1 )( — 1 )( 2 )( 2 ) - ( 2 )( 2 )( — 1 )( — 1 ) 

— (2)(—1)(—1)(2). 
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41. Con a u = 1> el determinante de la matriz 1, 2, 1 es det l y la in/e.sa 

(A -1 )¡¡ - n + 1 - máx (i,i). 

43 Al restar 1 del elemento n, n se resta su cofactor C m del determinante. Este cofac or 
' es C m = 1 (la menor matriz de Pascal). Al restar 1 de 1 se obtiene 0. 

Conjunto de problemas 4.4, página 225 

[20 -10 -12] 1 \ 2 ° -1 ° 

1. detA=20;C T = 0 5 0 ; AC T = 20/; A" 1 = - 0 5 0 . 

0 0 4 L.0 o • 4 J 

3 . ( x , y) = (d/( ad - be), -c/( ad - be)); (x, y, z) = (3, -1, -2). 

5. a) El área de ese paralelogramo es det j^_ 2 2 ] , por lo que el área del triángulo ASC 

es I 4 = 2. b) El triángulo A'B'C tiene la misma área; simplemente se ha movido ha¬ 
cia el origen. . , D 

7. Los pivotes de A son 2, 3 y 6 a partir de los determinantes 2, 3, y 36; los pivotes de B 

son 2, 3 y 0. 

9. a) P 2 lleva (1, 2, 3, 4, 5) a (3, 2, 5, 4, 1). 
b) P~ l lleva (1, 2, 3, 4, 5) a (3, 4, 5, 2, 1). 

U. Las potencias de P son todas las matrices permutación, por lo que finalmente una de 
esas matrices debe repetirse. Si P r es la misma que P s , entonces _ ' 

13 a) det A = 3, det B l = - 6 , det S 2 = 3, de modo que x, = -6/3 - 3 2 y *2 
3/3 = L b) 1A| = 4, |£il = 3, |£ 2 | = -2, |B 3 | = L Por tanto, *i - * *2 " 5 

y x — ~ 

15 . a) x, = § y x 2 = no hay solución, b) x t = § y x 2 = §: indeterminada. 

17 Si la primera columna de A es también el miembro derecho b, entonces det A - det 
8,“Lo B, como 8, con singólas.,« que se repite una columna. En contenerá, 
x¡ = \B X \/\A\ = 1 y x 2 = x 3 = 0. 

19. Si todos los cofactores = 0 (incluso en un solo renglón o en una sola columna), enton¬ 
ces det A = 0 (no hay inversa). A - [J ¡] no tiene cofactores cero pero no es inver- 

21 Si det A = 1 y se conocen los cofactores, entonces C T = A~' y también det A 1 = 1. 

' Debido a que A es la inversa de A“ \ A debe ser la matriz de cofactores de C. _ 
23. Una vez que se conoce C, el problema 22 proporciona det A = (det C) ^con « . 

Así, es posible construir A" 1 = C T /det A usando los cofactores conocidos. Para en¬ 
contrar A es necesario invertir. 

25. a) Cofactores C 2 i = C 31 = C 32 = 0. 

b) Cu = C 2u C 31 = C 13 , C 32 = C 23 hace simétrica a S ■ 

27. a) Área I 3 ]l = 10- b) Área del triángulo = 5. c) Área del triangulo = 5. 

2 111 

29. a) Área i 3 4 í = 5- b) 5 + nueva área del triángulo i o 5 1 = 5 + 7 = 12. 

31. Las aristas del hipercubo tienen longitud vTTTTT+T = 2. El volumen det H es 
2 4 = 16. (H /2 tiene columnas ortonormales. Así, det (H/ 2) - 1 lleva de nuevo a e 

H = 16). 


í-.-u-.U.U , 

U tv í V 


. teta- 

I «=MTt 

A i 

33. I ./?. 


DEL URUGUAY 


. C O Í -• . 2 , c! O M Á L 


:íonal ... 
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. --*-15541 i 423803 

^fíép^RÍé§n^ im ^ mé&salos A + B + D ( not C) - 

1 B Areas de mismas rectángulo A = 2(triángulo a) 

bases y mismas rectángulo B = 2(triángulo b) 

] D alturas rectángulo D = 2(triángulo d). 

Por lo que los triángulos a + b + d = \(x\y 2 — x 2 yi). 


Compruebe un ejemplo con (a, b) — (3, 2), (c, d) = (1, 4) y área = 10. La recta des¬ 
de (0, e) en el paso 3 tiene pendiente c/fl y su ecuación es y = e + ex/a. ¡El paso 3 
funciona porque ( b , d) está en esa recta! d = e + cb/a es verdadera, ya que ad — 
be = área ae en el paso 2. 

35. El cubo «-dimensional tiene 2" vértices, «2"“ l aristas y 2 n caras de dimensión n — 1. 
El volumen del cubo cuyas aristas son los renglones de 21 es 2 n . 


37. J = r. Las columnas son ortogonales y sus longitudes son 1 y r. 


22 dr/dx dr/dy _ cos$ sen 9 _ 1 

99 /dx 99 /dy (—sen 9)/r (cos#)/r r' 

41. S = (2, 1, — 1) proporciona un paralelogramo, cuya área es la longitud de un produc¬ 
to cruz: || PQ x £5|| = ||(—2, —2, —1)|| = 3. ¡Esto también proviene de un deter¬ 
minante! Los otros cuatro vértices podrían ser (0, 0, 0), (0, 0, 2), (1, 2, 2) y (1, 1, 0). 
El volumen de la caja inclinada es |det| = 1. 


x y z 

43. det 3 2 1 = 0 = 7x — 5y + z ; el plano contiene dos vectores. 

1 2 3_ 

45. VISA tiene cinco inversiones VI, VS, VA, IA, SA. Y AVIS tiene dos inversiones VI y 
VS. Debido a que 5 — 2 es impar, VISA y AVIS tiene paridad opuesta. 


Conjunto de problemas 5.1, página 240 

1. X = 2 y X — 3; traza = 5, determinante = 6. 

3. X = —5 y X = —4; las dos Xs son reducidas por 7, con vectores característicos sin mo¬ 
dificar. 

5. X = 3, X = 1, X = 0, con vectores característicos (1, 0, 0), (2, —1, 0), (3, —2, 1); traza 
= 4, det = 0. X = 2, X = 2, X = —2, con vectores característicos (1, 1, 1), (0, 1, 0), (1, 
0, — 1); traza = 2, det = —8. 

7. Ax = Xx proporciona (A — 7/)x = (A. — 7)x; Ax = Xx proporciona x = LA -I x, de 
modo que A~ l x = (í/X)x. 

9. El coeficiente de (—X)"~ l en (X¡—X)--- (X„ — X) es A.¡ + ■ • • + X n - En det (A — XI), 
un término que incluye un a¡j fuera de la diagonal excluye tanto a a u — X como a 
ajj — X. Este término no implica a (—A.)" -1 . Así, el coeficiente de (—A.)" -1 en det 
(A — XI) debe provenir del producto bajo la diagonal principal. Ese coeficiente es 
au H-1- a nn = A] + • • • + A.„. 

11. Trasponga A — XI: det (A - XI) = det (A — A/) T = det(A T — XI). 

13. Los valores característicos de A son 1, 2, 3, 7, 8, 9. 

15. rango(A) = 1, A. = 0,. .., 0, n (traza «); rango(C) = 2, X — 0, . . . , n¡ 2, — n/2 (tra¬ 
za 0). 

17. El tercer renglón contiene a 6, 5, 4. 
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19. A, A 2 y A°° tienen los mismos vectores característicos. Los valores característicos son 
1 y 0.5 para A, 1 y 0.25 para A 2 y 1 y 0 para A°°. En consecuencia. A 2 está a medio ca¬ 
mino entre A y A°°. 

21. A., = 4 y X 2 = -1 (compruebe la traza y el determinante) con x¡ = (1, 2) y x 2 = (2, 
— 1 ). A -1 tiene los mismos vectores característicos que A, con valores característicos 
1/A., = 1/4 y 1/A 2 = -1. 

23. a) Multiplique Ax para ver Xx, lo cual revela a X. b) Resuelva (A — Xípc = 0 para 
encontrar x. 

25. a) p u = = u(u T u) = u , de modo que X = 1. b) p v = ( M u T )v = m(jí t v) = 0, 

así que X — 0. c) x¡ = (—1, 1,0,0), X 2 = (—3,0, 1,0), x-¡ = (—5,0,0, 1) 
son ortogonales a i¡, por lo que son vectores característicos de P con X = 0. 

27. X 3 - 1 = 0 proporciona X = 1 y A = |(—1 ± ¿V3); los tres valores característicos 
son 1 , 1 , — 1 . 

29. a) rango = 2. b) det (B T B) = 0. No c). d) (B + /)"' tiene (A + l )" 1 = 1, 5 , 

31. a = 0, b = 9, e = 0 multiplican a 1, A, A 2 en det (A - XI) = 9X - X 3 : A = matriz 
acompañante. 

33. ® , 0 0’ -1 1 ■ Siempre A 2 = matriz cero si A = 0, 0 (Cayley-Hamil- 

ton). 

35. Ax = ciA,*, + • • ■ + c n X„x„ es igual a Bx — ciA,*, + • • • + c„X n x„ para todax 
Así, A = B. 



■ (a + b) 


d — b para obtener traza = a + d. 


39. Se requiere A 3 = 1, pero no A = 1 (para evitar /). Con A, = e 2n ' 13 y A 2 — e 2ir¡/3 , 
el determinante es A,A 2 = 1 y la traza es A, + A 2 = eos y- + i sen ^ + eos — - 

i sen y = — 1. Una matriz con esta traza — 1 y determinante 1 es A = _j ¿ j. 




.¿.a 
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9. Traza(AB) = traza (BA) = aq + bs + cr + dt. Así, traza (AB — BA) = 0 (siempre). 
Por tanto, AB - BA = I es imposible para matrices, ya que la traza de 1 no es cero. 


gonal! 
13. A = f 


"1 

1 

f 

[1 

0 

0' 

0 

1 

1 

. c) Falso; 0 

1 

0 

0 

0 

2 

[O 

0 

2 


19 0 1 

-10 11 


1 2 1 = í 1 1 
0 3J [01 


17. A = 


112 0 1 
0 10 5 0 


0 ] [1 - 1 ] [1 

3J ¡0 1J : [2 

-i] = [2 3" 
l 1J [0 5 ' 


; cuatro raíces cuadradas. 


1 1j ÍO 0 


-1 2j [0 3J i 


19. a) Falso; no se conocen As. b) Verdadero, c) Verdadero, d) Falso: ¡se requie¬ 
ren vectores característicos de S! 

21. Las columnas de S son múltiplos de (2, 1) y (0, 1) en cualquier orden. Lo mismo para 
A -1 . 

23. A y B tienen A 1 = lyA 2 =l.A + B tiene A, = 1 y A 2 = 3. Los valores característi¬ 
cos de A + B no son iguales a los valores característicos de A más los valores carac¬ 
terísticos de B. 

25. a) Verdadero, b) Falso, c) Falso (A podría tener 2 o 3 vectores característicos in¬ 
dependientes). 

-- . r 8 3l , „ , . r 9 41 . rio 51 . . 

27. A = _2 2 l u otra ), A = j , A = _ 5 q ; los únicos vectores caracte- 


, , . 9 4] . [10 5] , , . 

l otra), A = j , A = _ 5 Q ; los uní 


únicos vectores caracte¬ 


rísticos son (c, —c). 

29. SA k S~ 1 tiende a cero si y sólo si todo |A| < 1; B k 


0 desde A = 0.9 y A = 0.3. 


31. A 


0.9 0 

0 0.3 


0.3J’ S [l 

suma de estas dos. 


) í0 1 , B 10 


33 R k = [1 1] [3 0 ]* [1 1 ] = [3* 3 k -2 k ' 

' a [0 -1J [0 2J [0 -1J [O 2* ‘ 

35. Traza AB = ( aq + bs) + (cr + dt) = (qa + re) + (sb + td) = traza BA. Demostra¬ 
ción para el caso diagonalizable: la traza de SAS~ l es la traza de (AS~')S = A, que 
es la suma de los Xs. 

37. Las As forman un subespacio, ya que cA y A, + A 2 tienen la misma S. Cuando S = I, 
las As proporcionan el subespacio de las matrices diagonales. Dimensión 4. 

39. Dos problemas: el espacio nulo y el espacio columna pueden traslaparse, por lo que .r 
podría estar en ambos. En el espacio columna podría no haber r vectores característi¬ 
cos independientes. 


41. A 


, 11. „ Z 
A = . _ tiene A 

t u 

de Cayley-Ftamilton. 


matriz cero confirma el teorema 
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43 Por 5F B tiene los mismos vectores característicos (1, 0) y (0, 1) que A, por lo que B 

_ a b _ a 2b _ ü U son 

es diagonal. Las ecuaciones AB - BA - 2c 2d J 2 d\ [0 0J 

-b = 0 y c = 0: rango 2. 

45 A tiene X, = 1 y X 2 = 0.4 con x i = 2 ) y x z = A ~ . 

tSmos vectores característicos). A 100 tiene X t = 1 y X 2 = (0.4)-, que esta proxtmo 


Conjunto de problemas 5.3, página 262 

1. Los números de Fibonacci comienzan par, impar, impar. Así-impar + 

Los dos siguientes son impar (de impar + par y par + impar). Luego se repite impar 

+ impar = par. 


5. A = 


SA k S~' 


"1 ll = 1 [Xi 

1 0J Xi - X 2 L 1 
1 [X, X 2 ] \X\ 0' 

ljL° >4 


F 2 o — 6765. 


Xi oí r 1 
.o x 2 J 

—X 2 1 

X! 0 


(observe S '). 


(X*-X*)/(X,-X 2 )j 


7. La suma directa L k + L k . M proporciona Lq, .. ., L l0 como 2, 1, 3, 4, 7, 11, 18, 29, 47, 
76 , 123 . Con mi calculadora obtengo X}° = (1.618...) 10 — 122.991 .... que se 
redondea a L l0 — 123. , 


9. La matriz de transición de Markov es 


mueven. 


h \ 0 

^ 5 0 

i I 1 


i 0 . Las fracciones ~, 5 y 1 no se 


11. a) X = 0, (1, 1, -2). b) X = 1 y -0.2. c) límite (3, 4, 4) = vector característico para 
X = 1. 


13. a) 


0 < a < 1 
0 < b < 1. 


b/{l - «) 1 

1 -1 


1* 0 
0 (a - b) k 


b/(\ - a) 
1 


2b 

b — a + 1 
2(1 - a) _ 
b — a + \ 
2b 

b — a + 1 
2(1 — a) 
_b — a + 1 


b — a + 1 
1 — a — 


(a - b) k 


(a - b) 


si ja — b\ < 1; 


a = 1/3 
= -1/3 

no es de Markov. 


15. La suma de las componentes de Ax es x, + x 2 + x 3 (la suma de cada columna esj y 
no se pierde nada). La suma de las componentes de Xx es X(x t + x 2 + x 3 ). Si a r- , 
x l + x 2 + x 3 debe ser cero. 

17 í“ “1 es inestable para |a| > 1/2, y estable para |a| < 1/2. Es neutra para a = ± 1 12. 
a a. 
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0 

0 

2] . 

n 

1 

2 ' 

0 

0 

0 y A 3 = 0. Así, (/-A) 1= / + a+a 2 = lo 

1 

1 

0 

0 

0j 

Lo 

0 

1 


21. Si A se incrementa, entonces se consumen más bienes en la producción y la expansión 
debe ser más lenta. En términos matemáticos, Ax> tx debe seguir siendo verdadera si 
A se incrementa; f m4x se va para arriba. 

23 f 3 2 1 = I f 1 _1 ] [5 °1 [ 1 l] * 1 fl -ll [ 5 * 0] r 1 L 

‘23 21 1 0 1 —1 1 y ^ 21 10 1-11- 


23. I" 3 2 ] = - [) 

2 3J 2 L 1 

25 . r = 5 Vas -1 = 


por lo que su traza no es real. Observe que 
una raíz cuadrada real * . 


tiene R 2 = A. debería tener X = ~J9 y X = ~/—l, 

■_ j 0 ] 

sal. Observe que puede tener sf—X = i y — i, y 

1 1 L u 


27. A=5A l 5 I y B = SA 2 S *. Las matrices diagonales siempre proporcionan 
A 1 A 2 = A 2 Ai. Así, AB = BA, a partir de SAiS~ l SA 2 S~ l = SAiAzS" 1 — 
SA 2 A 1 S - 1 =SA 2 S- l SAiS~ l = BA. 

29. B tiene X = i y —i, de modo que B 4 tiene X 4 = 1 y 1; C tiene X = (1±V3¿)/ 2 = 
exp(±7u7 3), por lo que X 3 = —1 y — 1. Así, C 3 = —/y C 1024 = — C. 

Conjunto de problemas 5.4, página 275 

1. X, = -2yX 2 = 0;x, = (1, -l)yx 2 = (1, 1); 

At _ 1 e_2 ' + 1 —e~ 2 ’ 4- 1 

6 2 —e~ 2 ' + 1 e~ 2< + 1 


u(t) = 


e ~r Z 
-e 2 ‘ + 2 


; cuando t 


5. a) e M, + T) = Se Alt+T) S~ l 
b ) e A = I + A = \) ? 


, e“ = / + B 


1 = Se A 'S~ l Se AT S~ l 

' = ín “ÍIa+S 


proporciona e A+B = COS 1 “ sen 1 
[sen 1 eos 1 

Esta matriz es diferente de e A e B . 


= / + At 


; e At u( 0) = 


L° 1 J’ L 1 °J 

a partir del ejemplo 3 en el texto, en t = 1. 


4f + 3 
4 


9. a) X! = X 2 = 2=|32, ReX( > 0, inestable, b) X, = V7, X 2 = - v / 7, 

ReX| >0, inestable c) X ( = ^Lb/U , x 2 = ReX] >0, inestable 

d) Xj = 0, X 2 — —2, neutralmente estable. 

11. A 1 es inestable para t < 1, neutralmente estable para t > 1. A 2 es inestable para t < 4, 
neutralmente estable en t ~ 4, estable con X real para 4 < í < 5, y estable con X com¬ 
plejo para t > 5. A 3 es inestable para toda f > 0, porque la traza es 2t. 

13. a) u\ = cu 2 ~bu 3 , « 2 = —c«j +an 3 , « 3 = bui — au 2 proporciona w'ií 1 +uí,M 2 + M3n 3 =0. 
b) Debido a que e 4 ' es una matriz ortogonal, ||«(r)|| 2 = ||e Aí it(0)|¡ 2 = ||«(0)|| 2 es 
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constante, c) X = 0 y ±(Va 2 + b 2 + c 2 )i■ Las matrices simétricas sesgadas tienen 
Xs imaginarios puros. 


n 

15. u{t) = \ cos2í + ~ eos Vór ^ . 


17. Ax = XFx + X 2 x o bien, (A — XF — X 2 /)x = 0. 

19. Los valores característicos son reales cuando (traza) 2 - 4det > 0 =» -4(-a 
b 2 + c 2 ) > 0 =>■ a 2 + b 2 > c 2 . 

21. «, =e 4 ' q , M 2 =e' • Si m( 0) = (5,-2), entonces u(r) = 3e 4 ' * + 2e' . 


23. y „ = ? i ^ . Así se obtiene X = 1(5 ± Vil). 

y"J I 4 5 J l/J 

25. X, = 0 y X 2 = 2. Luego, v(í) = 20 + 10e 2 ' -> oo cuando t -> oo. 

27. A = 01 tiene traza 6, det 9, X = 3 y 3, con un solo vector característico indepen- 

—9 6 

diente (1,3). Así se obtiene y = ce 3 ', .y' = 3e 3 '. También te 3 ' resuelve y" = 6/ - 9y. 
29. y(í) = eos t empieza en y(0) = 1 y y'(0) = 0. La ecuación vectorial tiene u = (y, y') 
= (eos t, —sen /). 

31. Al sustituir u = e c, v se obtiene ce c 'v = Ae c ‘v — e c! b, o bien, (A — cí)v = b, o v = 
(A - cl)~ l b = solución particular. Si c es un valor característico, entonces A - el no 
es invertible: esta v fracasa. 

33. de A, /dt = A+ A z t + ±A 3 í 2 + gA 4 / 3 + ■ • • =A(/ + Ai + jA 2 / 2 + \A 3 t 3 + • • •) = 
Ae A ‘. 

35. La solución en el instante t + T también es e A< - ,+T) u( 0). Así, e*‘ multiplicada por F xr 
es igual a e A< - ,+T) . 

37. Si A 2 = A, entonces e At = I + At + 4 A/ 2 + | Ai 3 + •••=/+ (e' — 1)A 

_ Ti 0 e‘ — 1 e‘ — 1 _ e' e‘ — 1 

0 1 + 0 0 0 1 ' 


39. A 


i ii ri ii f3 o] o 


0 3 2 0 0 1 1 


1 

2 , entonces e A ‘ 
"5 


c' |(<? 3 ' — e')l _ , 
0 e 3í “ ' 


en í = 0. 

41. a) La inversa de 6 a ' es e~ At . b) Si Ax — Xx, entonces e^'x = e x, x y e X! ^ 0. 

, . Í2l [ll . , . „ . „_i [—1 6 

43. X = 2 y 5 con vectores característicos j y j . Asi, A=SA¿ — g 


Conjunto de problemas 5.5, página 288 

1. b) suma = 4 + 3 i; producto = 7 +i. c) 3+4/ = 3 — 4/; 1 — i = 1 + »; 

13 + 4¿ | = 5; 11 — i— V2. Ambos números están fuera de la circunferencia unitaria. 
3. x — 2 ~ i, xx = 5, xy = —1 + 7i, l/x — 2/5 — (1/5)/, x/y — 1/2 — (1/2)/; 
compruebe que |xy| = V50 = |x|¡y| y |l/x| = 1/V5 = l/|x|. 

5. a) x 2 = r 2 e m , x-' = (1 /r)e~ ie , x = re~ w \x~ l = x proporciona |x| 2 = 1: en la 
circunferencia unitaria. 
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1 i 0 
i 0 1 


0 ,C H 
1 


C porque (A H A) H = A H A. 


9. a) det A T : 
detA = 


= det A pero det A H = det A. b) A H 
real. 


A proporciona det A 


U. P: X. - 0,- 1. * - „ - [;/;e: i, - 1. i, - -1. x, - 

1 /V 2 ] _ r 1 /V 2 ]. , . _ f 2 /v 5 i _ r 1 /V 5 

[ 1 /V 2 J 2 ~ L-I/V 2 J’ ' ~ ’ Xl ~ 5 ’ Xl ~ U/V5j’ X2 " [“2/V5. • 

13. a) u, v y w son ortogonales entre sí. b) El espacio nulo es generado por u; el espacio 
nulo izquierdo es el mismo que el espacio nulo; el espacio renglón es generado por v y 
w; el espacio columna es el mismo que el espacio renglón, c) x = v — | w; no es 
único, ya que es posible sumar a x cualquier múltiplo de u. d) Se requiere b T u — 0. 
e) S~' = 5 T ; S~ l AS = diag(0, 1,2). 

15. La dimensión de S es n(n + l)/2, no n. Toda matriz simétrica A es una combinación 
de n proyecciones, pero las proyecciones cambian cuando A cambia. En el espacio S 
de matrices simétricas no hay base de n matrices proyección fijas. 

17. ( VV) H {UV ) = V H U H UV = V H /V = /.Así, UV es unitaria. 

19. La tercera columna de U puede ser (1, —2, i)/ Vó , multiplicado por cualquier núme¬ 
ro e' 9 . 

21. A tiene +1 o —1 en cada elemento en la diagonal; ocho posibilidades. 

23. Las columnas de la matriz XJ de Fourier son vectores característicos de P porque 
PU = diag(l, w, u) 2 , w 3 )U (y w = i). 

25. n 2 pasos para C directa multiplicada por x; sólo n log n pasos para F y F ~ 1 por la TFR 


(y n para A). 


27. A h A 


(A h A) h = A h A hh = A H A de nuevo. 

29. cA sigue siendo hermitiana para c real; (/ A) H = 

0 0 f 

31. P 2 = 1 0 0 , E 3 = /, P 100 = P"F 

0 1 0 
e 2íri/3 g 4ni/3 


33. c = 4 
5 


2 + 5 P +4P 2 tiene X(C) 


son matrices hermitianas. 


- iA es hermitiana sesgada. 


raíces cúbicas de 1 


2 -j- 5 -f- 4. 

2 + 5e l7Iin + 4e 4lrl73 
2 + óe 4 *' 73 + 4e iM3 


■s/3 L 1 + 1 1 


V3 


■s/3 L 1 


0 ] _L 

V3 
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con L 2 = 6 + 2 V3. 


1 fl + a /3 -l+¿l r l 0]1_[1+V3 1 * con L 2 =6+2^3. 

37 . y _ _ . i + V3J [0 -ij L L -i - i 1 + V3 J 

V=V H proporciona X real, con una unitaria se obtiene |X| =1, de modo que con una 

traza cero se obtiene X — 1, — L 2 - o-ii* —n 

39. No multiplique por e u ; primero conjúguelos, luego /„ e ,x dx-[e !2i] 0 - U. 
41 R + iS = (R + ¿S) H = R r ~~ isT R es simétrica pero S es simétrica sesgada. 


43. [!],[-«; ‘X.Í + 

45. (/ —2w« h ) h = / —2«w H ; (/ —2 mm h ) 2 = / —4uu H +4u(n H n)n H = I', la matriz nn H 
proyecta sobre la recta que pasa por u. 

47. Se tiene A + iB = (A + i 5) H = A J — iB 1 ■ Así, A = A T y B = —B . 




1 °1 i [ 2 + 2i ~ 2 ' 

0 4 6 _ 1 + i 2 


= SAS -1 . valores característicos rea- 


Conjunto de problemas 5.6, página 302 

!. C = N-'BN = N~'M~'AMN = (M A) -1 A(M1V); sólo M~ X 1M = / es semejante 
a /. 

3 Si /.i ,X„ son valores característicos de A, entonces Xi+1,...,X„ + son v o 

’ res característicos de A + /. Por tanto. Ay A + I nunca tienen los mismos valores ca¬ 
racterísticos, por lo que no pueden ser semejantes. 

5. Si B es invertible, entonces BA = B(AB)B~ l es semejante a Ai?. 

7 El elemento (3, 1) de M~ l AM es g eos é> + h sen 9, que es cero si tan# g 

9. Los coeficientes son c, = 1, c 2 = 2, d x = 1, d 2 - 1; compruebe Me - d. 

11. La matriz reflexión con base tq y u 2 es A = [? ¿]- La base V, y V 2 (¡misma refle¬ 
xión!) proporciona B = Si M = [} _}]. entonces A = MBM~ \ 


13. a) D = 0 0 2 . b) D 3 = 0 0 0 = matriz de terceras derivadas. Las ter¬ 

ceras derivadas de 1, x y x 2 son cero, de modo que D 3 = 0. c) X = 0 (triple); sólo un 

. . . , i •.^ _ /1 r\ r\\ 


vector característico independiente ( 1 , 0 , 0 ). 

15. Estos valores característicos son 1, 1, 1, — 1- Matrices características 


17 al rr H = U- l AUU H A H (U- l ) H = /• b) Si T es triangular y unitaria, entonces 
" sus elementos diagonales son cero porque las columnas deben ser vectores unitarios. 

19. Los elementos 1, 1 de T H T = TT H proporcionan |í,il 2 = Iflil 2 + \tn\+ I*»!, de 
modo que t , 2 = 1 13 = 0. Al comparar los elementos 2, 2 d eT T-TT se obtiene 
u, = 0. Entonces, T debe ser diagonal. 

21 Si N - UAU ~', entonces AA H = UAIT \U~ l ) H A H í/“ es igual a UAA U . Esto 
es lo mismo que C/A H At/ H = (I/AÍ/' l ) H (UAU ~ l ) = A«A. Por tanto, A es normal. 
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23. Los valores característicos de A(A — /)(A — 2/) son 0, 0, 0. 

_. a 2 + be ab + bd ] . , a b , . , , 

25. Siempre ¡ flc + c¿ + ¿a - (a + d) c ¿ + (a¿ - fc, 


Írí 2 ]" (a+d) [c *] ; 


27. M~ *7 3 M = 0, por lo que las dos últimas desigualdades son fáciles. Al intentar para 
M J¡ = J 2 M obliga a que la primera columna de M sea cero, por lo cual M no puede 
ser invertible. No es posible tener J t = M~ 1 J 2 M. 


61 

45] A 2 

13 

9 

“ 80 

P — P 

—59J’ 

-16 

-11 


3 i. * ¿ ° ° , J q , q \ son semejantes; * ° de suyo y ° ¿ de suyo. 

33. a) (M~ l AM)(M~ l x) = M~ l (Ax) = M~‘0 = 0. b) Los espacios nulos de A y de 
M”’AM tienen la misma dimensión. Vectores y bases distintas. 


5 .^ 


: 3 3c 2 ' 


; /o = /,y-> = 


37. m(í) = (ic(0) + rjc(0) + |í 2 y(0) + ir 3 z(0))e 5 '. 

39. a) Se escoge M, = matriz diagonal invertida para obtener M~ l J¡M¡ = Mj en cada 
bloque, b) M 0 tiene estos bloques M, en su diagonal para obtener M 0 “ ! J M 0 = J r . 
c) A t = (M~ l ) r J r M T es (M~ l ) r M q 1 JMqM t = (MM 0 M T )-‘A(MM 0 M T ), y 
A t es semejante a A. 

41. a) Verdadero; Una tiene X = 0, la otra no. b) Falso. Diagonalice una matriz no si- 

. . . .... , „ , f 0 ll fo ll _: \t —, 1 .. 


métrica y A es simétrica, c) Falso 


° y r° - 1 ! 

-1 oj y [l 0_ 


son semejantes, d) Verda¬ 


dero: todos los valores característicos de A + / se incrementan por 1, con lo cual son 
distintos de los valores característicos de A. 

43. Diagonales de 6 por 6 y de 4 por 4; AB tiene todos los mismos valores característicos 
que BA más 6 — 4 ceros. 


Conjunto de problemas 6.1, página 316 

1 . ac - b 2 = 2 — 4 = -2 < 0 ; x 2 + 4xy + 2y 2 = (x + 2y ) 2 - 2 y 2 (diferencia de 
cuadrados). 

3. det(A - X/) = X 2 - (a + c)X + ac - b 2 = 0 proporciona X, = ((a + c) + 

y/(a - c ) 2 + b 2 )/2 y X 2 = ((n + c) - Via - c) 2 +4b 2 )/2); h > 0 es una suma de 

números positivos; X 2 > 0 porque (a + c) 2 > (a — c) 2 + 4 b 2 se reduce a ac > b 2 . 

Mejor método: el producto XiX 2 = ac — b 2 . 

5. a) Positiva definida cuando — 3 < b < 3. 

b) ^ ^ = j ® ^ ® 2 l * c) El mínimo es-—i—— cuando 

! b 9 [b lj [0 9 - b 2 J [0 IJ 2(9 - b 2 ) 


01 [x 

, , que es 
1 v 


1 

9-b 2 


d) No hay mínimo; sean y —» oo. 


-3y, entonces x — y tiende a — oo. 
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1 

-1 

-f 

1 

-1 

-1 

-1 

1 

1 

y A 2 = —1 

2 

-2 

-1 

1 

1 

[-1 

-2 

11 


7. a) A, = -1 1 1 y A 2 - i * ~ 

-1 1 ij L" 1 - 2 n - 

b) fi = (*i - x 2 - X 3) 2 = 0 cuando xi - x 2 - *3 = 0 

r i 

c) / 2 = (jci - x 2 - X 3) 2 + (*2 ~ 3*3) 2 +X¡;L= -1 

h 61 Ti 01 T3 01 [1 21 • 1 r\o /'Apfíí’if 


0 0 " 

1 0 . 


L-l -3 

; los coeficientes de los cuadrados son los 


[3 6 _ 1 0 3 0 1 ¿\. los coe f lc i e ntes de los cuadrados son los 

9 ' A “ 6 16 ~ [2 lj [0 4J [0 IJ’ . r 

pivotes en D, mientras los coeficientes dentro de los cuadrados son columnas de L. 

11. a) Los pivotes son ay c — \b\ 2 l ay del A = ac — \b\ 2 - b) M»lSpli,«. M 1 P» 
(c _ |¿,|2 j a y C ) Ahora, ^Ajc es una suma de cuadrados, d) det - 1 (indefinida) y 

det = +1 (positiva definida). 

13. a > 1 y (a - l)(c - 1) > b 2 . Esto significa que A - / es positiva definida. 

15. f(x, y) = x 2 + 4xy + 9y 2 = (x + 2y) 2 + 5y 2 ; /( x, y) = x 2 + 6xy + 9y 2 = 

(x + 3y) 2 . 

17. x t A t Ax = (AxfiiAx) = longitud al cuadrado = 0 sólo si Ax = 0. Debido a que A 
tiene columnas independientes, esto sólo ocurre cuando x — 0. 

19. a = -4 4-8 sólo tiene un pivote = 4, rango = 1, valores característicos 24, 

8 -8 16 
0, 0, det = A. 

21. « 2 + 2 bxy + cy 2 tiene un punto silla en (0, 0) si nc < b 2 . La matriz es indefinida 
(X < 0 y X > 0). 

Conjunto de problemas 6.2, página 326 ^ 

1. A es positiva definida para a > 2. B nunca es positiva definida: observe 4 ? • 

3. det A = —2£> 3 - 'ib 1 + 1 es negativo en (y cerca de) b = 

5. Si x T Ax > 0 y x r Bx > 0 para cualquier x # 0, entonces x r (A + B)x > 0; condición (I). 

_ [3 ii r 3 -i] 

7. As positivos porque R es simétrica y VA > 0. R - j 3 1 « j_ x 3 J- 

9. |jc T Ay| 2 = \x T R T Ry\ 2 = |(/Lc) T .Ry| 2 < (por la desigualdad normal de Schwarz) 

||/Lt|| 2 ||i?yil 2 = (x J R T Rx)(y 7 R 7 Ry) = (x T Ax)(y T Ay). 

.. , Í3 -V2l 1 f U . i f^l a lo largo de los vec- 


3 tiene X = 1 y 4, ejes 1 L y ; 

-V2 2 K 2 J 2 


tores característicos. 

13. Matrices negativas definidas: (I) * T Ax < 0 para todos los vectores r diferentes de 

cero (II) Todos los valores característicos de A que satisfacen X¡ < 0. (UD aet Ai , 
det A 2 > 0, det A, < 0. (IV) Todos los pivotes (sin intercambios de renglones) satisfa¬ 
cen d¡< 0.' (V) Existe una matriz R con columnas independientes tal que A - -R di¬ 
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15. Falso (Q debe contener vectores característicos de A); verdadero (mismos valores ca¬ 
racterísticos que A); verdadero (Q l AQ = Q~ l AQ es semejante a A); verdadero (los 
valores característicos de e~ A son e~ x > 0 ). 

17. Empiece desde a M = (renglón j de i? T )(columna j de R ) = longitud al cuadrado de la co¬ 
lumna j de R. Así, det A = (det R) 2 = (volumen del paralelepípedo R) 2 < producto de 
las longitudes al cuadrado de todas las columnas de iR. Este producto es a ti a 2 2 - ■ ■ a nrl . 


19. A = 


1 tiene pivotes 2, 


-1 es singular; 

2 


21. x r Ax no es positiva cuando (x ¡, x 2 , x 3 ) = (0,1, 0) debido al cero en la diagonal. 

23. a) La condición de positiva definida requiere un determinante positivo (también que 
todas las X > 0). b) todas las matrices proyección, excepto /, son singulares, c) Los 
elementos diagonales de D son sus valores característicos, d) La matriz negativa de¬ 
finida —I tiene det = +1 cuando n es par. 

25. X t = l/fl 2 y X 2 = \/b 2 , de modo que a — l/V^T y b — 1/aAI . La elipse 9x 2 + 


16y 2 = 1 tiene ejes con semilongitudes a = i y b = 


27. A = 


tiene CC r 


4 8 

8 25 ■ 


29. ax 2 +2bxy+cy 2 - a{x + ¿y) 2 + 2x 2 + 8xy + 10y 2 = 2(x + 2y) 2 +2y 2 . 

31. x T Ax = 2(*i - \x 2 ~ \xfi) 2 + §(x 2 - x 3 ) 2 ; x T Bx = (xi + x 2 + x 3 ) 2 . B tiene un 
pivote. 

33. A y C t AC tienen Xj > 0, X 2 = 0. C(r) = tQ + (1 - t)QR, Q = * _j , 

'2 ol L J 

R = j ; C tiene un valor característico positivo y uno negativo, pero I tiene dos 

valores característicos positivos. 


35. Los pivotes de A - 1/ son 2.5, 5.9, -0.81, de modo que un valor característico de 
A — 1/ es negativo. Por tanto, A tiene un valor característico menor que -. 

37. rango(C T AC) < rango A, aunque también rango (C T AC) > rango ((C T ) -1 C T ACC -1 ) 
= rango A. 

39. No. Si C no es cuadrada, C r AC no es del mismo tamaño que la matriz A. 


41. det 


-4X/18 
— X/18 


—3 — X/18 
6 -4X/18 


0 proporciona Xi =54, X 2 


Vectores característicos 


43. Grupos: matrices ortogonales; e tA para toda t; todas las matrices con det = 1. Si A es 
positiva definida, el grupo de todas las potencias A k contiene sólo matrices positivas 
definidas. 
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Conjunto da problemas 6.3, página 337 


1. A t A = Lq gQ 1 sólo tiene o? = 85 con Ul - , de 


modo que v 2 : 


4/VTf 

-1/VI7. 


3. A t A 


tiene valores característicos a¡ 


3 + V5 2 3 

- 2 - y ^ = ” 


A = A T los vectores característicos de A T A son los mismos que para A. Debido a que 
X 2 = i(l-V5) es negativa, cr, = pero <r 2 = -X 2 . Los vectores característicos 
unitarios son los mismos que en la sección 6.2 para A, excepto por el efecto de este 
signo menos (ya que se requiere Av 2 = cr 2 u 2 ): 

A.,/ \/1 + Xj _ L 2 / \J\ + A-! 

“‘= v '= 1/ymfJ y 


5. AA t 


3 con u i 


_ ri/vi 


i i o 
1 2 1 
0 1 1 


1 tiene of 


' 1/vT 

y vector nulo, 1)3 = — 1/V3 


1 1 0 
0 1 1 


3 con vi 


V3 0 0' 
0 1 0 


1 /V 2 ]' 
’i/Vó 
= 2/V6 
.1/V6 


[t>i v 2 v 3 ] t . 


1 con u 2 


1 con v 2 


1/V2 

-1/V2 

1/V2 

0 

-1/V2 


7 . A = 12ku t tiene un valor singular a t = 12. 

9. Multiplique Í/X V T usando columnas (de £/) multiplicadas por renglones (de S V ). 
11. Para hacer singular a A, el cambio más pequeño iguala a cero su valor singular más 

pequeño, cr 2 . , . 

13. Los valores singulares de A + / no son a¡ + 1. Provienen de valores característicos de 

(A + /) T (A + /). 


15. A + = 


o 1] [1 00 
10010 


i o o' 

0 1 0 , B + 

0 0 1 


o r 

1 o ,c + 
o o 


A + es la inversa derecha de A; B + es la inversa izquierda de B. 


17. A t A 


tome las raíces cuadradas de 4 


y 16 para obtener S 


19. a) Con columnas independientes, el espacio renglón es todo R"; compruebe (A A) 
A+fo = ¿s+b. b) A T (AA T )~ l b está en el espacio renglón porque en este espacio se 
multiplica A t por cualquier vector; así, (A T A) A + b = A T AA T (AA T ) l b = A T b. Con 
ambos casos se obtiene A T Ax + = A 1 b. 
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21. Tome A 


ma 15 se tiene A 4 


y B = ® j ■ Así, AB = q ‘ . A partir de C + en el proble- 


(AS) + , y (AB) + f S + A + . 

1 . V'. \A 1 cj.lía.xrot* oí 


23. A ~ QiIZQl =>■ A = Q 2 T. Qj =» AA + = . Al elevar al cuadrado se 

obtiene (AA + ) 2 = g 1 S £ + £ X + gj = £2iXX + £2j y de manera semejante para 
(AA + ) 2 =AA + = (AA + ) t y A + A proyectan sobre el espacio renglón y el espacio 
columna de A. 


Conjunto de problemas 6.4, página 344 

1- P(x) = xf — X\X 2 + x| — x 2 x 3 + xf — 4x¡ — 4x¡ tiene 3P/3x t = 2xi — x 2 — 4, 
dP/dx 2 = — X\ +2^2 — x 3 , y dP/dx 3 — —x 2 + 2 x 3 ~ 4. 

3. Con dPjdx = x + y = 0 y 3P¡/3y = x + 2y - 3 = 0 seobtienex = -3 yy = 3. 

[i o' 

P 2 no tiene mínimo (sea y —> oo). Está asociado con la matriz semidefinida ^ ^ . 

5. Escriba x = (1,.... 1) en el cociente de Rayleigh (el denominador se convierte en n): 
Debido a que R(x) siempre está entre A t y A„, se obtiene nX x < x T Ax = suma de todas 
las a¡¡ < hk n . 

7. Debido a que x r Bx > 0 para todos los rectores x diferentes de cero, x T (A + B)x es ma¬ 
yor que x t Ax. Así, el cociente de Rayleigh es mayor para A + B (de hecho, todos los 
n valores característicos se incrementan). 

9. Debido a que x r Bx > 0, el cociente de Rayleigh es mayor para A + B que el cocien¬ 
te para A. 

11. Los valores característicos más pequeños en Ax = Ax y Ax = XMx son j y (3 — y/})/ 4. 
13. a) Xj — mín S y[máx x en S2 R(x)] > 0 significa que toda Sj contiene un vector x con 

R(x) >0. b) y = C~ l x proporciona el cociente ~R(y) = y ^ _ *_Ax _ 

R{x) > 0. xTx 

15. El subespacio extremo S 2 es generado por los vectores característicos x, y x 2 . 

17. Si Cx = C(A~ l b ) es igual a d, entonces CA~ 1 b — d es cero en el término de correc¬ 
ción en la ecuación (5). 


Conjunto de problemas 6.5, página 350 


2 

-1 

0' 

'3/16' 

-1 

2 

-1 

4/16 = b = 

0 

-1 

2 

3/16 

v 2 + 

Ay 
16 y3 

es igual a la k = A, A 


1/2 .El elemento lineal finito 
. 1 / 2 . 

A exacta en los nodos x = !, 



2 

-1 

0 ' 

,b = \ 

2 ' 

3. A 33 — 3, ¿3 — ^. Asi, A — 3 

-1 

2 

-1 

2 


0 

-1 

1 

3 

1 


Ay — b proporciona y 


Soluciones a ejercicios seleccionados 


5. Integre por partes: - V"V¡dx - f 0 V¡'V¡dx { v í v i\ x ^ 0 Io V ¡ V j dx 

misma Ay. 

7 . a = 4 , M = i • La razón 12 (el cociente de Rayleigh sobre el subespacio de múlti¬ 
plos de V (x)) es mayor que el valor característico verdadero X = ir . 

9. La matriz masa M es h /6 veces la matriz tridiagonal 1, 4, 1. 


Conjunto de problemas 7,2, página 357 

1. Si Q es ortogonal, su norma es ||Q|| = máx ||0x||/M = 1 porque Q preserva la lon¬ 
gitud: 110*11 = ||x|| para todax. Q~ x también es ortogonal y su norma es 1, de modo 
que c(Q) = 1. 

3 ||ABx|| < HAH ||Bx||, por definición de la norma de A, y así ||Bx|| < ||B||||x|l. Al dividir 
' entre ||x|| y maximizar, ||AB|| < ||A||||B||. Lo mismo se cumple para la inversa, 
|iB“ I A _1 || < I|B -1 1I1IA _1 1I; c(AB) < c(A) c(B) al multiplicar estas desigualdades. 

5. En la definición ||A|| = máx j|Ax||/||x|j, x se escoge como el vector característico par¬ 
ticular en cuestión: ||Ax|| = |X|l|x||, de modo que la razón es |X| y la razón máxima es 
por lo menos |X|. 

7. A t A y AA t tienen los mismos valores característicos, ya que con A T Ax = Xx se obtie¬ 
ne AA r (Ax) = A(A T Ax) = X(Ax). La igualdad de los valores característicos más gran¬ 
des significa ||A || = ||A T ||. 

9A= 0 J,B = ° °,X máx (A + B)>X máx (A)+X máx (B)(yaquel>0 + 0), 

y X^ÍAB) > X máx (A)X máx (B). Por tanto, /- máx (A) no es una norma. 


11. a) Sí, c(A) = ||A|| ||A _1 |I = CÍA l ), ya que (A 1 ) 1 es A de nuevo, b) A l b 


, 115* ti 

S* A « !, |A" , II W 


Esto es ■ 


1 \m\ 


, llíftll < ..... Esto es MñJI > IJÜM. 

conduce a— < IIAII IIA II ^ ■ Esto ^ _ c pj| 

13. ||A|| = 2 y c = 1; ||A|| = V2 y c es infinita (¡singular!); HAH = a/ 2 y c = 1. 

15. Si = Á rnin = 1, entonces todos los X¡ = 1 y A = S7S~ 1 = I. Las únicas matrices 
con ||A || = ||A — 1 H = 1 son matrices ortogonales, porque A T A tiene que ser I. 

17. El residuo b - Ay = (1CT 7 , 0) es mucho menor que b - Az = (0.0013, 0.0016). Sin 
embargo, z está mucho más cerca de la solución que y. 


19 . x 2 + • • • + x 2 no es más pequeño que máx(x?) = (IMIoo ) 2 y no es más grande que 
(|*,| + • • ■ 4- ¡x„|) 2 , que es (||x||i) 2 . Ciertamente, x\ + • • • + x 2 < n máx(x?), de 
modo que 11*11 < V«ll*Hoo. Se escoge y = (signxj, signx 2 ,.. •, signx„) para obte¬ 
ner x- y = H*|l r. Por la desigualdad de Schwarz, esto es cuando mucho llx||||y|| = 
Vñ||x. Se escoge x = (1, 1,.... 1) para razones máximas ^fñ■ 


’ 9 -36 30' 

21. La inversa exacta de la matriz de Hilbert de 3 por 3 es A -1 = -36 192 -180 . 

30 -180 180 

23. El l|x|| = l|A - 1 b|| más grande es 1 /X mín ; el error más grande es 10 16 Amfn- 


’l 0] Í2 2 
25. Intercambie 2 2 a 1 0 


0 f 

U con P = J Q y 
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1 0 
0.5 1 


2 2 0 
1 0 1 
0 2 0 


2 

2 

0 ' 

r° 

1 

0 ] 

1 

0 

0 ' 

0 

2 

0 

= U. Entonces PA = LU con P = 0 

0 

II 

0 

1 

0 

0 

0 

1 

_1 

0 

OJ 

0.5 

-0.5 

1 


Conjunto de problemas 7.3, página 365 
1. n 0 = LH« 2 = f Íl>«3 = 


1 normalizado a un 
-1 vector unitario. 


u k /X\ = c ( Xi + c 2 x 2 {X 2 /Xi) k + • • • + c n x n (X n /Xi) k C\x x si 

|X f /X,| < 1. La razón máxima controla, cuando k es grande. A 
|X 2 | = |X,| y ninguna convergencia. 

..s 2 (x-y) T x _ __ 


ciX[ si todas las razones 
mde. A = ^ q tiene 


5. Hx = x — (x 
es x = Hy. 


(x - y) T (x - y) 


eos# sen# _ _ 

sene 0 j ~ QR ~ 
Entonces RQ = [ C *''*_ + 3 S } 


(x — y) = y. Entonces H(Hx ) = Hy 


y entonces U 1 AU 


1 eos 9 sen 6 
0 —sen 2 6 


-5 

0 

9 

12 

25 

25 

12 

16 

25 

25. 


11. Suponga que (Q 0 ■ ■ ■ Q k -i)(R k -i • • • Rq) es la factorización QR de A k (lo cual cierta¬ 
mente es verdadero si k — 1 ). Por construcción, A*+i = RkQk de modo que R k = 
A k+ 1 Qj = ÍQl ■ ■ ■ QqAQo ■ ■ ■ Q k )Qj- Al multiplicar por la derecha por (B*_ t • • • 
R 0 ), la hipótesis proporciona R k ■ ■ ■ R 0 = Qj ■ ■ ■ Qj,A k+l . Después de pasar las Qs al 
miembro izquierdo, este es el resultado requerido para A 4-1-1 . 

13. A tiene valores característicos 4 y 2. Escriba un vector unitario en el renglón 1 de P: 

1 ri -1 1 nxn -i í 2 -4] 1 [1 —3l Í4 —4] 

es ya sea jJ y PAP = [ 0 4 J o - 7 = [3 1 jyBAB> = ^ {) 2 j. 

15. Py usa 4 n multiplicaciones (2 por cada elemento en los renglones i y f). Al factorizar 
eos 0, los elementos 1 y ± tan 9 sólo requieren 2 n multiplicaciones, lo cual lleva a | 
n 3 para PR. 

Conjunto de problemas 7.4, página 372 


valores característicos p = 0, ±1/V2; (D + L ) -1 


, valores característicos 0 , 0 , l/ 2 ; cu ópt = 4 — 2 v / 2 , reduciendo 
X máx a 3 -2V2 « 0 . 2 . 





Soluciones a ejercicios seleccionados 


3, =(2 —2cos knh)x t -,Jx k = \(sen2knh, senlknh +sen knh,...) 

(eos knh)x k . Para h=-,A tiene valores característicos 2 - 2 eos - = 2 - y/2. 


2 — eos 


= 2, 2 — eos 


;2 + \/ 2 . 


5. i = D~ l (L + t/) 


2 _ 1 

; los tres círculos tienen radios r t = r 2 - 


1 Sus centros están en cero, de modo que todo |X,| < 4/ 5 < 1. 
5' 


-£> _1 (L + U) 


tiene /i. 


V 

’ \ad J 


-(D + L) l U 


■ 0, bc/ad; A. máx es igual a /r máx . 


[0 Wfláj 

9. Si Ax = Lx, entonces (/ - A)x = d ~ *)*• Los valores característicos reales de 
B = / - A tienen j 1 - X| < 1, en el supuesto de que X este entre 0 y 2. 

11 Siempre IIABII < ||A|| ||B||. Se escoge A = B para encontrar ||B 2 || < ||B|I 2 . Luego se es- 
co^eA = B 2 pañi encontrar ||S 3 || < l|£ 2 liPH < ||B 3 1|. Continúe (o aplique mdu^ 
Debido a que ||B|| > máx |a(B)|, no es sorprendente que con PII < 1 obtenga 

convergencia. r Q r 

„„ _ , . . a c -i T _ i '1 con IXLn, = i Gauss-Seidel tiene S 'T= i 

13. Jacobi tiened 1 ~ í \ q 1 3 L u 5. 


; i. Gauss-Seidel tiene S 1 T 


con |XU = i=(|XU Jacobi) 2 . 

15. Sobrerrelajamiento (SRS) sucesivo en MATLAB. __ 

17 Todas las sumas máximas de los renglones son |Á| < 0.9 y \X\ < 4. Los circuios alre- 
' dedor de los elementos de la diagonal proporcionan coto más estrecto. Pnmera A. J 
círculo IX — 0 21 < 0.7 contiene a los demás circuios \X 0.3| _ . y I 

.alores caracteristicoí. Segundé e. Celo |X - 2, < 7 co„Oe- 

ne al círculo |X - 2| < 1, a todos los tres valores característicos 2 + V2, 2, y 2 VA. 
19 r , = b - ctxAb = b - (b T b/b T Ab)Ab es ortogonal a r 0 = b: los residuos r b 
' -Axson ortogonales en cada paso. Para demostrar ^amen- 

p x se simptiñea a cPp. Pi = \\Abfb - (b Ab)Ab y c-b b/(b Ab \- 
' MUI» = o va que A T = A. (Esta simplificación coloca a a, enp, - b a¿u> + 
(A - 2a^Ab +anAbf)b/b l b. Para un buen análisis, consulte la obra Numen- 

cal Linear Algebra de Trefethen y Bau). 


Conjunto de problemas 8.1, página 381 

1. Los vértices están en (0, 6), (2, 2), (6, 0); consulte la figura 8.3. 

3. Las restricciones proporcionan 3(2x + 5y) + 2{—3x + 8y) < 9 10, o 

31y < -1 No es posible tener y > 0. 

5. x > 0, y > 0, con restricciones adicionales de que x + y < 0 sólo admite el punto 
7. Abonos al 5%) = z (bonos al 9%) = 20 000 y y (bonos al 6%) = 60 000. 
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9. El costo a minimizar es lOOOx + 2000y + 3000z + 1500n + 3000u + 37 QGuj. Las 
cantidades x, y, z a Chicago y u, v, w a Nueva Inglaterra satisfacen x + u — 1 000 000; 

y + v = 1 000 000; z + w — 1 000 000; x + y + z = 800 000; u + v + w = 

2 200 000. 

Conjunto de problemas 8.2, página 391 

1. En el presente, x 4 = 4 y x 5 = 2 están en la base, y el costo es cero. La variable de en¬ 
trada debe ser x 3 para reducir el costo. La variable de salida debe ser x 5 , ya que 2/1 es 
menor que 4/1. Con x 3 y x 4 en la base, las restricciones proporcionan x 3 = 2, x 4 = 2, 
y ahora el costo es x t + x 2 — x 3 = — 2. 

3. Los “costos reducidos” son r = [1 1], de modo que el cambio no es bueno y el vér¬ 

tice es óptimo. 

5. En P, r = [—5 3]; así en Q, r = [| —|j; R es óptimo porque r > 0. 

7. Para un problema de maximización, la prueba de detención se convierte en r < 0. Si 

fracasa, y el i-ésimo componente es el más grande, entonces esa columna de N entra 
en la base; la regla 8C para el vector que sale de la base es la misma. 

9. BE = B[- ■ • v ■ ■ •] = [•••«•••], ya que Bv = u. Por tanto, la matriz correcta es E. 

11. Si Ax = 0, entonces Px = x — A T (AA T ) -1 Ax = x. 

Conjunto de problemas 8.3 página 399 

1. Maximizar 4y¡ + lly 2 , con y t > 0, y 2 > 0, 2y t + y 2 < 1, 3y 2 < 1; el original tiene 
x* — 2, x* = 3, el dual tiene yf = f, y* = j, costo — 5. 

3. El dual maximiza yb, con y > c. En consecuencia, x = b y y = c son factibles, y pro¬ 
porcionan el mismo valor cb para el costo en el original y en el dual; por 8F deben 
ser óptimas. Si b x < 0, entonces la óptima x* cambia a (0, .... b n ) y y* = 

(0, c 2 ,..., c„). 

5. ¿> = [0 1] T , y c = [-1 0], 

7. Debido a que ex =2 = yb,xy y por 8F son óptimas. 

9. x* = [1 0] T y y* = [1 0], con y*b = 1 = ex*. Las segundas desigualdades tanto 

en Ax* > b como en y*A < c son estrictas, por lo que las segundas componentes de 
y* y x* son cero. 

11. a) x* = 0, x* = 1, x* = 0, c T x = 3. b) Es el primer cuadrante con el tetrae¬ 
dro en el vértice de corte. c) Maximizar y t , sujeto a yi > 0, y¡ < 5, y ¡ <3, 
yt < 4; y* = 3. 

(2 1 0] 

13. Aquíc = [l 1 l]conA= ^ ^ . No hay restricción x > 0, por lo que el dual 

tiene la igualdad yA = c (o A T y = c T ). Así se obtiene 2y, = 1 y y, = 1 y y 2 = 2 y ningu¬ 
na solución factible. Así, el máximo del original debe ser oo: x x = —N y x 2 = 2 N y x 3 = 0 

proporcionan Costo = x¡ + x 2 + x 3 = N (arbitrariamente grande). 


"1 

0 

0 

-1 

0 

0' 

'1 

0 

0 

-f 

15. Las columnas de 0 

1 

0 

0 

-1 

0 

o 0 

1 

0 

-1 

0 

0 

1 

0 

0 

-1 

[o 

0 

1 

-1 


17. Tome y = [1 — 1]; entonces yA > 0 ,yb< 0. 
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Conjunto de problemas 1,4, página 406 

1. El flujo maximal es 13, con el corte minimal que separa el nodo 6 de los otros nodos. 

3. Al incrementar la capacidad de los tubos del nodo 4 al nodo 6 o del nodo 4 al nodo 5 
se obtiene el incremento máximo en el flujo maximal. El flujo maximal crece de 8 a 9. 

S. Asigne capacidades = 1 a todas las aristas. Entonces, el número máximo de rutas aje¬ 
nas desde s hasta t es igual al flujo máximo. El número mínimo de aristas cuya elimi¬ 
nación desconecta s de t es el corte mínimo. Así, flujo máx = corte mín. 

7. Los renglones 1, 4 y 5 violan la condición de Hall; la submatriz de 3 por 3 que provie¬ 
ne de los renglones 1, 4 y 5 y de las columnas 1, 2, 5 tiene 3 + 3 > 5. 

9. a) La matriz tiene 2 n unos, que no es posible cubrir por menos de n rectas porque ca¬ 
da una cubre exactamente dos unos. Se requieren n rectas; debe haber un apareamien¬ 
to completo. 

'1 1 1 1 r 

1 0 0 0 1 

b) 1 0 0 0 1 . Los unos pueden cubrirse con cuatro rectas; cinco matrimo- 

1 0 0 0 1 

1 ! 1 i 1 

nios no es posible. 

11. Si cada m + 1 se casa sólo con el hombre aceptable m, entonces no hay nadie que se 
case con el #1 (aun cuando todos sean aceptables para el #1). 

13. Con el algoritmo 1 se obtiene 1-3, 3-2, 2-5, 2-4, 4-6, y con el algoritmo 2, 2-5, 4-6, 2- 
4, 3-2, 1-3. Estos son los árboles generadores más cortos de la misma longitud. 

15. a) Los renglones 1, 3 y 5 sólo tienen unos en las columnas 2 y 4. b) Las columnas 
1, 3 y 5 (en los renglones 2 y 4). c) La submatriz cero desde los renglones 1, 3 y 5 
y las columnas 1, 3 y 5. d) Los renglones 2 y 4 y las columnas 2 y 4 cubren todos 
los unos. 


Conjunto de problemas 8.5, página 413 

1. —10*1 +70(1 —xi) = 10xi - 10(1-x,), o bien, x, = \,x 2 = ±; ~10yi + 10(1- 
yi) = 70yi — 10(1 — yi), o bien, y x — y 2 = pago medio yAx — 6. 

3. Si X escoge la columna j, Y elegirá su elemento más pequeño a tj (en el renglón i). 
X no se moverá, porque este es el mayor elemento en ese renglón. En el problema 
2, ci 12 = 2 era un equilibrio de este tipo. Si se intercambian el 2 y el 4 debajo del a 12 , 
ningún elemento tiene esta propiedad, por lo que se requieren estrategias mezcladas. 


5. La mejor estrategia para X combina las dos rectas para obtener una recta horizontal, 
garantizando esta altura de 7/3. La combinación es |(3y +2(1 — y)) + 5 (y +3(1 — 
y)) = 7/ 3, por lo que X escoge las columnas con frecuencias 0, 

7. Para las columnas, se quiere x¡a + (1 — x\)b = x x c + (1 — x x )d = u , de modo que 
Xi(a — b — c + d) = d — b. Para los renglones, y x a + (1 — yi)c = y x b + 

(1 — y\)d = v intercambia b y c. Compare u con v: 


u = x¡ (a — b) + b 


(a — b){d — b) ad — be 

-+ b = —----- 

a—b—c+d a—b—c+d 


lo mismo después de 


b «->• c = v. 
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9. El máximo interior es el mayor de yj y y 2 ; x se concentra en ése. Sujeto ay¡ + y 2 = 1, 
el mínimo de la y más grande es |. Observe A = I. 

11. Ax* = |] T y yAx* — jjpi + |y 2 = | para todas las estrategias de Y; 

y*A = [5 | — 1 — l]yy*Ax = \x x + ~x 2 — X 3 — x 4 , que no pueden exceder 

4; en medio está y*Ax* = ~. 

13. Valor 0 (juego justo). X escoge 2 o 3, y escoge impar o par: x* = y* — ( 5 , |). 

Conjunto de problemas A, página 420 

1. a) Mayor dim (S n T) = 7 cuando ScT. b) Menor dim (S D T) = 2. c) Menor 
dim (S + T) = 8 cuando S C T. d) Mayor dim (S + T) = 13 (todo R 13 ). 


3. V + WyVHW contienen 


a X2 

a¡3 

«14 

a 22 

«23 

«24 

&32 

«33 

«34 

0 

«43 

«44 


an «12 0 0 

0 a 22 a 23 0 
0 0 a 33 a 34 

0 0 0 CÍ44 


dim(V + W) = 13 y dim (V fl W) = 7; se suma para obtener 20 = dim V + dim W. 
5. Las rectas que pasan por (1, 1, 1) y (1, 1, 2) tienen V fl W = {0}. 

7. Una base para V + W es v x , v 2 , ui,; dim (V fl W) = 1 con base (0, 1,-1, 0). 

9. La intersección de los espacios columna es la recta que pasa por y = (6, 3, 6): 

í 1 5 lrn f 3 °] T 2 i f 1 5 3 01 1 

y = 3 0 = 0 1 í coincide con [A £]x = 3 0 0 1 " = 0. 


"1 

5 

3 

0] 

1 

1 

_ /") 

3 

0 

0 

1 

2 

4 

0 

2J 



y = 3 0 L = 0 1 coincide con [A 5]x = 3 0 0 1 = 0. 

2 4J L J [0 2j LU |2 4 0 2 J -Í 

La dimensión de los espacios columna es 2. La suma y la intersección de ellos son 
3 + 1 = 2 + 2. 


11 . F 2 ®F 2 = ^ 


1 1 

1 -1 

-1 -1 

-1 1 


13. A 3 d — (Aid ® ® /) + (/ ® A 1D ® /) + (I ® I ® Aid). 

Conjunto de problemas B, página 427 

- 2 ol F° 1 °~ 

1 . J — q o (A es diagonalizable); 7= 0 0 0 (vectores característicos (1, 0, 

0) y (2,-1,0). L° 0 °. 

'1 t 2fl 

3. e Bt — 0 1 0 = / + Bt porque B 2 = 0. También e u = / + Jt. 

0 0 0 


T 0 0" 

5 . J — 0 4 0 (valores característicos distintos); J 

0 0 6 _ 

0, pero rango 1). 


(.B tiene 7 = 0, 





ga® a a b b | 

Factonzaeiones matriciaies 


1 A ~ LU — ( L triangular inferior \ / U triangular superior \ 

\ unos en la diagonal J \ pivotes en la diagonal J 
Requerimientos: Ningún intercambio de renglones mientras la eliminación gaussia- 
na reduce A a U. 

A ~ T mi - ( L triangular inferior \ í matriz de pivotes \(U triangular superior \ 
y unos en la diagonal J y D es diagonal J unos en la diagonal J 
Requerimientos: Ningún intercambio de renglones. Los pivotes de D se dividen pa¬ 
ra dejar unos en U. Si A es simétrica, entonces U es L r y A = LDL r . 

3. PA = LU (matriz permutación para evitar ceros en las posiciones pivote). 
Requerimientos: A es invertible: Así, P, L, U son invertibles. P realiza el intercam¬ 
bio de renglones de antemano. Alternativa: A = L { P y Ü\. 

4. EA = R CE invertible de m por m)(cualquier A) = rref(A). 

Requerimientos: ¡Ninguno! La forma escalonada reducida R tiene r renglones pivo¬ 
te y columnas pivote. El único elemento diferente de cero en una columna es el pivote 
unitario. Los m - r últimos renglones de E son una base del espacio nulo izquierdo de 
A, y así las r primeras columnas de E~ x son una base para el espacio columna de A. 

5. A = CC T — (Matriz triangular inferior C)(la traspuesta es triangular superior). 
Requerimientos: A es simétrica y positiva definida (todos los n pivotes en D son po¬ 
sitivos). La factorización de Cholesky tiene C — L^J~D. 

6. A — QR = (columnas ortonormales en 0(triangular superior R). 

Requerimientos: A tiene columnas independientes. Éstas son ortogonalizadas en Q 
mediante el proceso de Gram-Schmidt. Si A es cuadrada, entonces Q~ 1 = Q T . 

7. A = SAS~ l = (vectores característicos en S)( valores característicos en A)(vectores 
característicos izquierdos en S ~'). 

Requerimientos: A debe tener n vectores característicos linealmente independientes. 

8. A = QAO T = (matriz ortogonal 0(matriz A de valores característicos reales)(0 es 

Q~ l ). 

Requerimientos: A es simétrica. Este es el teorema espectral. 

9. A = MJM ~ 1 = (vectores característicos generalizados en M)(bloques de Jordán en 

Requerimientos: A es cualquier matriz cuadrada. La forma de Jordán J tiene un blo¬ 
que para cada vector característico de A independiente. Cada bloque tiene un valor ca¬ 
racterístico. 


WEV T 


U ortogonal 
es de m X m 


Matriz EdemXn 
, . . . , cr r en la diagonal 


V ortogonal 
es de n X n 


y m i v 


UCt. UtIUÜUftl 

j ó f\ < 4 A. c.- i L} A L» 
Factonzacia 


actonzaciones matriciaies 


■ 541 / 423803 


( DVS) tiene l os 

v ectores car acterísticos de AA T "en Ü y los de A T A en V; ty¡ — (A T A) = 


A + _ y'z + u t _ / ortogonal \ / diagonal l/a x , ..., l/<y r \ ( ortogonal 
\ de n por n J y d en por m J y de m por m 

Requerimientos: Ninguno. La seudoinversa tiene A + A = proyección sobre el espa¬ 
cio renglón de A y AA + = proyección sobre el espacio columna. La solución más cor¬ 
ta por mínimos cuadrados de Ax = b es x = A + b. Esto resuelve A t Ajc = A T ¿. 


12. A = QH = (matriz ortogonal 0 matriz H positiva definida simétrica). 
Requerimientos: A es invertible. Esta descomposición polar tiene H 2 = A T A. El fac¬ 
tor H es semidefinido si A es singular. La descomposición polar inversa A = KQ tie¬ 
ne K 2 = AA t . Con base en la DVS, ambas tienen Q = UV l . 

13. A = í/Aí / -1 = (¡7 unitaria)(matriz valor característico A)(í / -1 = f/ H = U T ). 
Requerimientos: A es normal : A H A = AA H . Sus vectores característicos ortonorma¬ 
les (y tal vez complejos) son las columnas de U. Los Xs son complejos a menos que 
A = A» 


14. A = UTU~ l = (U unitaria)(r triangular con Xs en la diagonal)! U~ l = U H ). 

Requerimientos: Triangularización de Schur de cualquier A cuadrada. Existe una 
matriz U con columnas ortonormales que hace triangular a U~ X AU. 


I D F n /2 [ Permutación 

/ —D F „/2 par-impar 


un paso de la TFR. 


Requerimientos: F n — matriz de Fourier con elementos W jk donde w n = 1, w = 
e 2m ' Así, F n F n = ni. D tiene 1, w, w 2 , ... en su diagonal. Para n = 2 f , la transfor¬ 
mada de Fourier rápida (TFR) tiene \nl multiplicaciones de las l etapas de las Ds. 
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' Glosario: Un diccionario 
ie álgebra lineal 


Base de V Vectores independientes v¡,.... v d cuya com¬ 
binación lineal proporciona todo v en V. ¡Un espacio vec¬ 
torial tiene muchas bases! 

Base normal de R" Columnas de la matriz identidad de n 
por n (se escribe i,j, k , en R 3 ). 

Cociente de Rayleigh q(x) = x 7 Ax/x T x Para cada A = 
A T , ^-mín ^ í(*) 2 X máx . Estos extremos se alcanzan en los 
vectores característicos x para X mín (A) y X máx (A). 

Cofactor Cy Quitar el renglón i y la columna j; multi¬ 
plicar el determinante por (— 1 )' +J . 

Columnas pivote de A Columnas que contienen pivotes 
después de la reducción de renglones; no son combinaciones 
de columnas anteriores. Las columnas pivote son una base 
del espacio columna. 

Complemento de Schur S = D — CA~ l B Aparece en la 
eliminación por bloques de ^ ®j. 

Compare Lq = 2 con los números de Fibonacci. 
Combinación lineal cv + dw o EcjVj Suma vectorial y 
multiplicación por un escalar. 

Conjugado complejo z — a — ib para cualquier número 
complejo z = a + ib. Así, zz — |z| 2 . 

Conjunto v lt . . . , v m generador de V Todo vector en V 
es una combinación de iq,... , v m . 

Cuatro subespacios fundamentales de A C(A), N(A ), 

c(a t ), nía 7 ). 

Descomposición dei valor singular (SVD) A = l/2V T = 
(U ortogonal) multiplicada por (diagonal 2 ) multiplicada 
por (V T ortogonal V T ) Las primeras r columnas de U y V 
son bases ortonormales de C(A) y C(A T ), con Av¡ = <x¡u¡ y 
valor singular a¡ > 0. Las últimas columnas de U y V son ba¬ 
ses ortonormales de los espacios nulos de A T y A. 
Descomposición polar A = OH Q ortogonal, H positiva 
(semi) definida. 

Desigualdad de Schwarz | v • te] < ||u|| ||u;||. Así, 

\v 7 Aw \ 2 < (v 7 Av)(w 7 Aw) si A = C T C. 

Desigualdad del triángulo jl« + it|| < ||«[| + ||wj| Para 
normas matriciales, || A + B || < || A || + || B ||. 

Desplazamiento cíclico 5 Permutación con j 21 — 1, S 32 — 
1, . . . , por último = 1. S.us valores característicos son 


n raíces e 2 '"' k ‘ n de 1; los vectores característicos son colum¬ 
nas de la matriz de Fourier F. 

Determinante |A| = det(A) Definido por det / = 1, con 
inversión de signo para intercambio de renglones, y linea- 
lidad en cada renglón. Así, |A| = 0 cuando A es singular. 
También, |AB| = |A||B|, |A~‘| = 1/|A| y |A T | = |A|.Lagran 
fórmula para det (A) tiene una sumatoria de n! términos, y 
en la fórmula de cofactores se utilizan determinantes de ta¬ 
maño n — 1 y el volumen de la caja = |det (A)|. 

Diagonalización A = S _I ASA = Matriz de valores ca¬ 
racterísticos y S = matriz de vectores característicos. A de¬ 
be tener n vectores característicos independientes para que 
5 sea invertible. Todas las A* = S\ k S~ l . 

Dimensión del espacio vectorial dim(V) = número de 
vectores que hay en cualquier base de V. 

Ecuación característica det (A — XI) = 0. Las n raíces 
son los valores característicos de A. 

Ecuación normal a 7 Ax = A T h proporciona la solu¬ 
ción por mínimos cuadrados de Ax = 0 si el rango total de 
A es íi. La ecuación establece que (columnas de A) • 
(b - Ax) = 0. 

Eigshow Valores característicos y valores singulares grá¬ 
ficos de 2 por 2. (MATLAB o Java). 

Eliminación Sucesión de operaciones en los renglones 
que reduce A a una U triangular superior o a la forma re¬ 
ducida R = rref(A). Así, A = LU con multiplicadores íy en 
L, o PA = LU con intercambio de renglones en P, o EA = 
R, con una E invertible. 

Elipse (o elipsoide) x T Ax = 1 A debe ser positiva defini¬ 
da; los ejes de la elipse son vectores característicos de A, con 
longitudes l/VX- (Para ||x|l = 1, los vectores y = Ax 
están en la elipse ||A“ 1 y|| 2 = y T (AA T )“ 1 y = 1 mostra¬ 
da por eigshow; las longitudes de los ejes son a¡). 

Espacio columna C(A) Espacio de todas las combina¬ 
ciones de las columnas de A. 

Espacio nulo N(A) Soluciones de Ax = 0. Dimensión n — 
r = (# columnas) — rango. 

Espacio nulo izquierdo ¿V(A T ) Espacio nulo de A T = "es¬ 
pacio nulo izquierdo” de A porque y 7 A — 0 T . 

Espacio renglón C(A T ) Todas las combinaciones de los 
renglones de A. Por convencionalismo; vectores columna. 


Espacio vectorial V Conjunto de vectores tales que todas 
las combinaciones cv + dw permanecen en V. En la sección 
2.1 se proporcionan ocho reglas necesarias para cv + dw. 

Espectro de A Conjunto de valores característicos 
{Xi,...,X„}. 

Exponencial La derivada de e A ‘ — ! + At+(_At) 2 / 2! 
+... es Ae A! ; eA‘ u( 0) resuelve u’ = Au. 

Factorización A = LU Si con la eliminación se llega de A 
a U sin intercambio de renglones, entonces la triangular in¬ 
ferior L con multiplicadores íy (y í¡¡ =1) regresa de U a A. 

Factorización de Cholesky A = CC T = (L-/d)(¿v / D) T 
para A positiva definida. 

Factorizaciones simétricas A = LDL T y A = QAQ y El 
número de pivotes positivos en D y valores característicos 
positivos en A es el mismo. 

Forma de Jordán J = M _1 AM Si A tiene s vectores ca¬ 
racterísticos independientes, su matriz “generalizada” M de 
vectores característicos proporciona J = diag(7,,..., J s ). El 
bloque J k es A.¿4 + N k , donde N k tiene unos en la diagonal 

l. Cada bloque tiene un valor característico X k y un vector 
característico (1, 0 ,..., 0). 

Forma escalonada reducida por renglones R = rref(A) 
Pivotes = 1; ceros arriba y abajo de los pivotes; r renglones 
diferentes de cero de R constituyen una base para el espacio 
renglón de A. 

Gráfica de G Conjunto de n nodos unidos por parejas 
mediante m aristas. Una gráfica completa contiene todas 
las n(n — l)/2 aristas entre los nodos. Un árbol sólo contie¬ 
ne n — 1 aristas y no contiene circuitos cerrados. 

Gran fórmula para determinantes de n por n det(A) 
es una sumatoria de ni términos, uno para cada per¬ 
mutación P de las columnas. Ese término es el producto 
a la • • • a n¡u en la diagonal de la matriz reordenada, multi¬ 
plicado por det(P) = ±1. 

Inversa derecha A + Si el rango total del renglón de A es 

m, entonces A + = A T (AA T ) _I tiene AA + = /„,. 

Inversa izquierda A + Si el rango columna completo de 
A es n, entonces A + = (A T A) -1 A T tiene A + A = /„. 

La multiplicación por bloques de AB es permitida si las 
formas de los bloques lo permiten (las columnas de A y los 
renglones de B deben estar en bloques que correspondan). 

Ley asociativa (AB)C — A(BC) Los paréntesis pueden 
quitarse para dejar ABC. 

Ley distributiva A + (B + C) = AB + AC Se suma y 
luego se multiplica, o se multiplica y luego se suma. 

Leyes de Kirchhoff Ley de la corriente: La corriente ne¬ 
ta (en salida menos) es cero en cada nodo. Ley del voltaje: 
La suma de las diferencias de potencial (caídas de tensión) 
es cero en cualquier circuito cerrado. 

Longitud llxjl Raíz cuadrada de x T x (teorema de Pitágo- 
ras en n dimensiones). 


Matrices de conmutación AB = BA En caso de ser dia- 
gonalizables, comparten n vectores característicos. 

Matrices semejantes A y B B = M~ 1 AM tiene los mis¬ 
mos valores característicos que A. 

Matriz A positiva definida Matriz simétrica con valores 
característicos positivos y pivotes positivos. Definición: 
x r Ax > 0 a menos que x = 0. 

Matriz A semidefinida (Positiva) semidefinida significa 
simétrica con x r Ax > 0 para todos los vectores x. Por tanto, 
todos los valores característicos X > 0; no hay pivotes nega¬ 
tivos. 

Matriz A = »»' r 0 con rango 1 Los espacios columna 
y renglón = rectas cuy cv. 

Matriz acompañante En el renglón n se escribe c¡, ... , 
c„ y en la diagonal se escriben n - 1 unos. Entonces det 
(A — XI) — ±(c 1 + C 2 X + C3X 2 + ••■)• 

Matriz aleatoria rand(n) o randn(n) MATLAB crea una 
matriz con elementos aleatorios distribuido uniformemente 
en [0 1] para rand, y con una distribución normal estándar 
para randn. 

Matriz aumentada [A b\ Ax = b es resoluble cuando 
b está en el espacio columna de A; así, el rango de [A b ] 
es el mismo que el de A. La eliminación en [A b] preser¬ 
va correctas las ecuaciones. 

Matriz circulante C Diagonales constantes se envuelven 
como en un desplazamiento cíclico. Toda matriz circulante 
es col + c¡S + • • • + c n -iS n ~‘. Cx = convolución c * 
x. Los vectores característicos están en F. 

Matriz de adyacencia de una gráfica Matriz cuadrada 
con ay = 1 cuando hay un lado que va del nodo i al nodo 
j; en caso contrario, a¡¡ = 0. A = A 7 para una gráfica no 
dirigida. 

Matriz de covarianza 2 Cuando las variables aleatorias 
x¡ satisfacen media = valor medio = 0, sus covarianzas Ey 
son los promedios de x¡x Con las medias x¡, la matriz S = 
media de (x — xj(x — x) T es positiva (semi)definida: es 
una matriz diagonal si las x¡ son independientes. 

Matriz de eliminación = Matriz elemental Ey La ma¬ 
triz identidad con un —¿y en el elemento i,j (i ¥= j). Así, 
Ey resta l¡¡ veces el renglón j de A dei renglón i. 

Matriz de HUbert hilb(«) Elementos H¡¡ = l/(i + j — 1) = 

f 0 l x'~ ¡ x J ~~ l dx. Positiva definida pero extremada¬ 
mente pequeño y número de condición grande. 

Matriz de incidencia de una gráfica dirigida La matriz 
de incidencia de m por n aristas-nodos tiene un renglón por 
cada arista (del nodo i al nodo j), con elementos — 1 y 1 en 
las columnas i y j. 

Matriz de Pascal P s = pascal(n) La matriz simétrica con 
elementos binomiales (‘^¿7 2 )' Todos los Fj = P¿Pu 
contienen el triángulo de Pascal con det = 1 (consulte el ín¬ 
dice para encontrar más propiedades). 
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Matriz de permutación P Hay n! órdenes de 1,.... n; 
las ni Ps tienen los renglones de / en el mismo orden. PA 
coloca las columnas de A en el mismo orden P es un produc¬ 
to de intercambios de renglones P¡f, P es par o impar (det 
P = 1 o — 1) con base en el número de intercambios. 


Matriz de rigidez K Cuando x proporciona los movi¬ 
mientos de los nodos en una estructura discreta, Kx propor¬ 
ciona las fuerzas internas. A menudo K = A T CA, donde C 
contiene constantes de resorte de la ley de Hooke y Ax = 
alargamiento (esfuerzos) de los movimientos x. 


Matriz de rotación R 


eos 9 
sen# 


—señó 
eos ó 


hace rotar el 


plano un ángulo 9, y R~ 1 = R r lo hace girar un ángulo —9. 
Matriz ortogonal, valores característicos e‘ e y e~' 9 , vectores 
característicos ( 1 , ±¿). 


dnV3 n están relacionadas según d — Me. (Para n = 2, se hace 
vi — muuH + 1)2 = m i 2 ¡ni + mr¡v¡ 2 I) 

Matriz M de Markov Todos los m¡j > 0 y la suma de ca¬ 
da columna es 1. El valor característico máximo es X = 1. 
Si m¡j > 0, las columnas de M k tienden al vector caracterís¬ 
tico de estado estacionario Ms = s > 0. 

Matriz normal N NN T = ¿V T 1V, que conduce a vectores 
característicos (complejos) ortonormales. 

Matriz N del espacio nuio Las columnas de N son las 
n — r soluciones especiales de As — 0. 

Matriz nilpotente N Alguna potencia de N es la matriz 
cero, N k = 0. El único valor característico es A. = 0 (repeti¬ 
do n veces). Ejemplos: matrices triangulares con diagonal 
cero. 


Matriz diagonal D d¡¡ = 0 si i v 4 j. Diagonal por blo¬ 
ques: ceros fuera de los bloques cuadrados D¡¡. 

Matriz diagonalizable A Debe tener n vectores carac¬ 
terísticos independientes (en las columnas de S\ en forma 
automática con n valores característicos diferentes). Así, 
S~ l AS = A = matriz de valores característicos. 

Matriz en bloque Una matriz puede separarse en matrices 
por bloques, cortando entre renglones y/o entre columnas. 

Matriz escalonada V El primer elemento diferente de 
cero (el pivote) en cada renglón aparece después del pri¬ 
mer pivote en el renglón previo. Todos los renglones cero 
vienen al último. 

Matriz F de Fourier Los elementos F/¿ = e 27! ‘I kl n 
proporcionan columnas ortogonales ~F r F = ni- Por tanto, 
y = Fe es la transformada discreta (inversa) de Fourier 
yj — Y. c\e 2rzí¡ki n . 

Matriz H de Henkel Constante a lo largo de cada antidia¬ 
gonal; hf¡ depende de i + j. 

Matriz H de Hessenberg Matriz triangular con una dia¬ 
gonal adyacente adicional diferente de cero. 

Matriz hermitiana A 11 = A T = A Análogo complejo 
de una matriz simétrica ají = a ¡j ■ 

Matriz hipercubo pf En el renglón n + 1 se cuentan 
las esquinas, las aristas, las caras, etc., de un cubo en R". 

Matriz identidad I (o /„) Elementos diagonales = 1, ele¬ 
mentos fuera de la diagonal = 0. 

Matriz indefinida Matriz simétrica con valores caracterís¬ 
ticos de ambos signos (+ y —). 

Matriz inversa A -1 Matriz cuadrada con A _1 ° = / y 
AA _! = I. No tiene inversa si det A = 0 y rango (A) < n; 
además, Ax = 0 para un vector x diferente de cero. Las in¬ 
versas de AB y A T son B~ 'A -1 y (A~ l ) r . La fórmula de co- 
factores es (A — CjJáetA. 

Matriz M de cambio de base Los vectores Vj de la base an¬ 
terior son combinaciones 2m,yU ;¡ de los vectores de la base 
nueva. Las coordenadas de ciut +-b c„v n = d\W{ -i-b 


Matriz ortogonal Q Matriz ortogonal con columnas orto- 
normales, de modo que Q r Q = I implica 0 T = Q~ l . Preser¬ 
va ángulos y longitud. ||Qx|| = ||x|| y (2*) T (£?y) = x T y 
Todos los |/.| = 1, con vectores característicos ortogonales. 
Ejemplos: Rotación, reflexión, permutación. 

Matriz proyección P sobre el subespacio S La proyec¬ 
ción p = Pb es el punto más próximo a b en S; el error e = 
b - Pb es perpendicular a S. P 2 — P = P T , los valores ca¬ 
racterísticos son 1 o 0; los vectores característicos están en 
S o en S -1 . Si las columnas de A = base de S, entonces P = 
A(A t A)-‘A t . 

Matriz reflexión Q — I- 2«u T El vector unitario u se re¬ 
fleja en Qu = -u. Todos los vectores x en el plano u T x — 0 
permanecen sin cambio porque Qx = x. La “matriz del in¬ 
quilino” cumple Q t = QT' = Q- 

Matriz simétrica A La traspuesta es A T = A, y a,j = a¡¡. 
A -1 también es simétrica. Todas las matrices de la forma 
R t R, LDlJ y QAQ r son simétricas. Las matrices simétricas 
tienen valores característicos reales en A y vectores carac¬ 
terísticos ortonormales en <2- 

Matriz simétrica sesgada K La traspuesta es —K, ya que 
Ky = —Kj¡. Los valores característicos son puramente ima¬ 
ginarios, los vectores característicos son ortogonales; e K ‘ es 
una matriz ortogonal. 

Matriz singular A Matriz cuadrada que no tiene inversa: 
det (A) = 0. 

Matriz T de Toeplitz Matriz con diagonal constante, de 
modo que t¡¡ sólo depende de j — i. Las matrices de Toeplitz 
representan filtros lineales invariantes en el tiempo en el 
procesamiento de señales. 

Matriz traspuesta A T Los elementos A?. = Ají- es 

de n por m; A T A es cuadrada, simétrica yjpositiva semidefi- 
nida. Las traspuestas de AB y A -1 son B T A T y (A T ) -1 . 

Matriz tridíagonaí T ty — 0 si ¡i — j\ > [. T~ l tiene ran¬ 
go 1 arriba y abajo de la diagonal. 

Matriz unitaria u B = Ü r = U~ l Columnas ortonorma¬ 
les (análogo complejo de Q). 


| 


Matriz V de Vandermonde Ve — b proporciona el polino¬ 
mio p(x) = cq+ • • • +c n -\x n ~ l con p(x¡) = b¡ en n pun¬ 
tos. Vy = (x¡Y~ ', y det V = producto de ( x k — x¡) para k > i. 

Método de Gauss-Jordan A se invierte con operaciones 
en los renglones sobre [A /] para llegar a [/ A -1 ]. 

Método simplex de programación lineal El vector x de 
costo mínimo se encuentra desplazándose de un vértice ha¬ 
cia el vértice de menor costo a io largo de las aristas del con¬ 
junto posible (donde se satisfacen las restricciones Ax = b 
y x > 0). ¡El costo mínimo se encuentra en un vértice! 

Método iterativo Secuencia de pasos que se siguen para 
aproximarse a la solución deseada. 

Método del gradiente conjugado Sucesión de pasos para 
resolver una positiva definida Ax — b minimizando 
i¡x T Ax — x T b sobre subespacios crecientes de Krylov. 

Multiplicación Ax = x¡ (columna 1) + • • • + x„(columna 
n ) = combinación de columnas. 

Multiplicación de matrices AB El elemento i, j de AB 
es (renglón i de A) • (columna j de B) = Por colum¬ 

nas: columna j de AB — A multiplicada por la columna j de 
B. Por renglones: el renglón i de A multiplica a B. Columnas 
por renglones: AB — suma de (columna &)(renglón k). Todas 
estas definiciones equivalentes provienen de la regla de que 
AB multiplicada por x es igual a A multiplicada por Bx. 

Multiplicador i¡¡ El renglón pivote j se multiplica por íy 
y se resta del renglón i para eliminar el elemento i,j: ty = 
(elemento a eliminar)/0’-ésimo pivote). 

Multiplicidades AM y GM La multiplicidad algebraica 
AM de un valor característico X es el número de veces que 
X aparece como raíz de det (A — XI) = 0. La multiplicidad 
geométrica GM es el número de vectores independientes (= 
dimensión del espacio característico para X). 

Norma ||A |l de una matriz La “norma l 2 ” es la razón má¬ 
xima IIArll/M = <W Así, ||Ax|| < ||A||||x||, ||A£|| SS |¡A|| 
||R||, y ||A + S|| S jj A j[ + |*||. Norma de Frobenius Las 

normas || A||^ = Y 53 a fj > ^ 1 son ^ m áximas su¬ 
mas de columnas y renglones de |a,y|. 

Número de condición cond(A) = /c(A) = ||A||||A _1 || = 
°máx/<rmín. En Ax = b, el cambio relativo Px||/||x|[ es 
menos que cond(A) multiplicado por el cambio relativo 
JjSízJJ / • Los números de condición miden la sensibili¬ 

dad de la salida al cambio en la entrada. 


Números de Fibonacci 0, 1, 1, 2, 3, 5,..., que satisfacen 
F„ = F„_i + F n - 2 = (A.? - xq)l(X , - X 2 ). La razón 

de crecimiento X¡ = (l + V5) / 2 es el valor caracterís¬ 


tico máximo de la matriz de Fibonacci 




o • 


Números de Lucas Ln = 2, 1 , 3, 4, ... , satisfacen 
L n — Ln- 1 + L n -2 = X” + X% con valores característicos 

Xi,X 2 = (1 ± V5)/2 de la matriz de Fibonacci [! íl. 


Ondas w Jk (t) o vectores w Jk Reescalan y desplazan el eje 
del tiempo para crear w Jk (f) = Wg&St — k). Los vectores 
provenientes de iuoo = (1, 1, —1, -1) deben ser (1, —1, 0, 
0)y (0,0, 1, -1). 

Ortogonalización de Gram-Sehmidt A = QR Colum¬ 
nas independientes en A, columnas ortonormales en Q. Ca¬ 
da columna q¡ de Q es una combinación de las j primeras 
columnas de A (y al revés, de modo que R es triangular su¬ 
perior). La simbología es diag (/?) > 0. 

Pivote d El primer elemento diferente de cero cuando un 
renglón se utiliza en eliminación. 

Plano (o hiperplano) en R" Las soluciones de a T x = 0 
proporcionan el plano (dimensión n — 1) perpendicular a 
a # 0. 

Pivoteo parcial Durante la eliminación, el y-ésimo pivote 
se elige como el elemento más grande disponible (en valor 
absoluto) en la columna j. Así, todos los multiplicadores sa¬ 
tisfacen l£y¡ S 1. El error por redondeo está controlado (de¬ 
pendiendo del número de condición de A). 

Polinomio mínimo de A El polinomio de menor grado 
con m(A) — matriz cero. Las raíces de m son valores carac¬ 
terísticos, y m{X) divide a det (A - XI). 

Producto cruz u X v en R 3 Vector perpendicular a u y 
v, de longitud || u || || v || | sen 9\ = área del paralelogramo, 
calculada como el “determinante” de [i j k\ u¡ u 2 u¡, v¡ 
v 2 v 3 J. 

Producto de Kronecker (producto tensoriai) A ® B Blo¬ 
ques ayB, valores característicos X p (A)X g (B). 

Producto punto x T y = x¡y¡ + ■ ■ ■ + x^„ El producto 
punto complejo es x T y ■ El producto punto de vectores 
perpendiculares es cero. (AB ),,¡ = (renglón i de A)-(colum¬ 
na j de B). 

Producto externo u v T Columna multiplicada por renglón 
= matriz de rango 1. 

Proyección p = a(a T b/a r a) sobre la recta que pasa por a 
El rango de P = aa T /a T a es 1. 

Punto silla de/(x„..x„) Punto en que las primeras de¬ 
rivadas de / son cero y la segunda matriz de derivadas 
(3 2 f/ 3x,-3 xj — matriz hessiana) es indefinida. 

Radio espectral = |A m¡¡x |. 

Rango A(r) Es igual al número de pivotes = dimensión 
del espacio columna = dimensión del espacio renglón. 

Rango total de la columna r — n Columnas indepen¬ 
dientes, N(A) — (0), sin variables Ubres. 

Rango total del renglón r = m Renglones independientes, 
por lo menos una solución de Ax = b\ el espacio columna 
es todo R"‘. Rango total significa rango total de la colum¬ 
na o rango total del renglón. 

Red Gráfica dirigida que tiene c¡, ... ,c m constantes aso¬ 
ciadas con las ||A|| aristas. 

Regla de Cramer para Ax = b Bj tiene b reemplazando 
la columna j de A y x¡ = |By|/| A|. 
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Representación por columna de Ax = b El vector b se 
convierte en una combinación de las columnas de A. El 
sistema sólo es resoluble cuando b está en el espacio 
columna C(A). 

Representación por renglón de Ax = b Cada ecuación 
proporciona un plano en R"; los planos se cortan en x. 

Seudoinversa A + (inversa de Moore-Penrose). La ma¬ 
triz n por m que “invierte” a A del espacio columna al es¬ 
pacio renglón, con N(A + ) = N(A r ). A + A y AA + son las 
matrices proyección sobre el espacio renglón y el espacio 
columna. Rango (A + ) = rango (A). 

Sistema resoluble Ax = b El miembro derecho b está en 
el espacio columna de A. 

Solución completa x = x p + x n de Ax = b ( x p particular) 
+ ( x n en el espacio nulo). 

Solución particular x p Cualquier solución de Ax = b; a 
menudo x p tiene variables libres = 0. 

Solución por mínimos cuadrados x El vector x que mi¬ 
nimiza el error ||e|| 2 resuelve A T Ax = A T b. Así, e = b — 
Ax es ortogonal a todas las columnas de A. 

Soluciones especiales de As = 0. Una variable libre es 
s¡ = 1, las demás variables libres = 0. 

Subespacio de Jírylov K/A, b) Subespacio generado por 
b, Ab ,.... A?~ { b. Métodos numéricos aproximan A/~ 'b por 
Xj con residuos b - Ax¡ en este subespacio. Una buena ba¬ 
se de Kj requiere sólo multiplicación por A en cada paso. 

Subespacios ortogonales Todo v en V es ortogonal a to¬ 
do w en W. 

Subespacio S de V Cualquier espacio vectorial dentro de 
V, incluyendo V y Z = {vector cero}. 

Suma V + W de subespacios Espacio de todos (los v 
en V) + (los w en W). Suma directa: dim(V + W) = dim 
V + dim W, cuando V y W sólo comparten el vector cero. 

Sustitución hacia atrás Los sistemas triangulares supe¬ 
riores se resuelven en orden inverso, de x„ a x¡. 

Suma vectorial v + u> = (iq + w¡ + . ■ . + v„ + w„) — 
diagonal del paralelogramo. 

Teorema de Cayley-Hamilton p(X) = det (A — XI) tiene 
p(A) = matriz cero. 

Teorema fundamental El espacio nulo N(A ) y el espacio 
renglón C(A T ) son complementos ortogonales (subespacios 
perpendiculares de R" con dimensiones r y n — r) de Ax = 


0. Aplicado a A T , el espacio columna C(A) es el comple¬ 
mento ortogonal de ¿V(A T ). 

Teorema espectral A = QAQ 1 A simétrica real tiene 
real y q¡ ortonormal, con Aq¡ = X¡q¡. En mecánica, q¡ pro¬ 
porciona los ejes principales. 

Transformada de Fourier rápida (TFR) Factorización 
de la matriz de Fourier F„ en matrices S¡ í = log 2 n multi¬ 
plicadas por una permutación. Cada S¡ sólo requiere n ¡2 
multiplicaciones, de modo que t y F~ l c pueden calcu¬ 
larse con nll 2 multiplicaciones. Es revolucionaria. 

Transformación afín Tlv ) = Av + v 0 = transformación 
lineal más desplazamiento. 

Transformación lineal T Cada vector v en el espacio de 
entrada se transforma en T(v) en el espacio de salida, y la li- 
nealidad requiere T(cv + dw ) = cT(v) + dT(w). Ejemplos: 
multiplicación matricial Av, diferenciación en el espacio de 
funciones. 

Traza de A Suma de los elementos en la diagonal = su¬ 
ma de los valores característicos de A. Tr AB = Tr BA. 

Una gráfica dirigida tiene una flecha especificada en cada 
arista. 

. . . linealmente dependientes Una combinación 

diferente de todos los c¡ — 0 proporciona Sc ; u¡ = 0. 

Valor característico X y vector característico x Ax — 
Xx con x ¥= 0, de modo que det(A — XI) = 0. 

Variable libre x¡ La columna i carece de pivote en la eli¬ 
minación. Es posible asignar cualesquiera valores a las n — 
r variables libres, y luego Ax ~ b determina las r variables 
pivote (¡en caso de ser resoluble!) 

Vector v en R" Sucesión de n números reales v = (v¡, 
. ... v„) = punto en R". 

Vectores independientes v¡, . . . , v k Ninguna combina¬ 
ción cqtq + • • • + c k v k = vector cero a menos que todas las 
c¡ = 0. Si las us son las columnas de A, la única solución 
de Ax = 0 es x = 0. 

Vectores ortonormales q k ,... ,q„ Los productos punto 
son qjqj — 0, si ¡ # y y qjq¡ — 1. La matriz Q con es¬ 
tas columnas ortonormales cumple Q T Q = /. Si m = n, en¬ 
tonces <2 t = Q~ l y q u . . . , q n es una base ortonormal de 
R"; toda v = T~l(u T ff/)<?;■ 

Volumen de una caja Los renglones (o las columnas) de 
A generan una caja con volumen |det (A)|. 



Códigos de 


enseñanza MATLAB 


cofactor 

cramer 

deter 

eigen2 

eigshow 

eigva! 

eigvec 

elim 

findpiv 

fourbase 

grams 

house 

inversa 

leftnull 

linefit 

Isq 

normal 

nulbasis 

orthcomp 

partic 

plot2d 

plu 

poiy2str 

project 

projmat 

randperm 

rowbasis 

samespan 

signperm 

slu 

slv 

splu 

splv 

symmeig 

tridiag 


Calcula la matriz de cofactores de n por n. 

Resuelve el sistema Ax = b con la regla de Cramer. 

Matriz de determinantes calculada a partir de los pivotes en PA = LU. 

Valores característicos, vectores característicos y det (A - Al) para matrices de 2 
por 2. 

Demostración gráfica de valores característicos y valores singulares. 

Valores característicos y su multiplicidad como raíces de det (A — Al) = 0. 
Calcula tantos vectores característicos linealmente 
independientes como es posible. 

Reducción de A a forma escalonada reducida R por medio de una E invertible. 
Encuentra un pivote para eliminación gaussiana (utilizado por plu). 

Construye bases para todos los cuatro subespacios fundamentales. 
Ortogonalización mediante el proceso de Gram-Schmidt de las columnas de A. 
Matriz de 2 por 12 que proporciona las coordenadas de los vértices de una casa. 
Matriz inversa (en caso de existir) por eliminación gaussiana. 

Calcula una base para el espacio nulo izquierdo. 

Gráfica el ajuste por mínimos cuadrados a m puntos dados por medio de una recta. 
Solución por mínimos cuadrados de Ax = b a partir de A T Ax = A T b. 

Valores característicos y vectores característicos ortonormales cuando A T A = AA T . 
Matriz de soluciones especiales de Ax = 0 (base para el espacio nulo). 

Encuentra una base para el complemento ortogonal de un subespacio. 

Solución particular de Ax = b, con las tres variables libres iguales a cero. 

Gráfica bidimensional para las figuras de las casas. 

Factorización rectangular PA = LU con intercambios de renglones. 

Expresa un polinomio como una cadena. 

Proyecta un vector b sobre el espacio columna de A. 

Construye la matriz proyección sobre el espacio columna de A. 

Construye una permutación aleatoria. 

Calcula una base para el espacio renglón a partir de los renglones pivote de R. 
Prueba si dos matrices tienen el mismo espacio columna. 

Determinante de la matriz permutación con renglones ordenados por p. 
Factorización LU de una matriz cuadrada sin usar ningún intercambio de renglones. 
Aplica slu para resolver el sistema Ax = b sin permitir intercambios de renglones. 
Factorización cuadrada PA = LU usando intercambios de renglones. 

Solución de un sistema cuadrado invertible Ax — b. 

Calcula los valores característicos y los vectores característicos de una matriz 
simétrica. 

Construye una matriz tridiagonal con diagonales constantes a , b, c. 


Estos códigos de enseñanza están disponibles directamente a partir de la Linear Algebra Home page: 
http: //web. mit. edu/l8.06/www. 

Fueron escritos en MATLAB y traducidos a Maple y Mathematica. 
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Submatriz principal, 87 
Sucesión de Krylov, 365 
Suma, 7-8, 21, 70-73, 82, 115, 
126-127, 176-178, 181-184 
Suma de cuadrados, 142, 160, 166, 
177, 182, 199, 318-323, 327, 
464 

Suma de espacios, 415-421 
Suma de vectores, 6 
Sumatoria, 142, 160, 168, 177, 182, 
199,318-320, 327 
Superposición, 237 
Sustitución hacia atrás, 12, 36 

T 

Tabla (tableau), 386-388 
Tablero de ajedrez, 139, 216, 242 
Tensor, 2, 418 
Teorema espectral, 285 
Teorema flujo máx-corte mín, 402 
Teorema fundamental del álgebra 
lineal, 106, 116-117, 141, 
146-147, 335, 398 
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Jegrejn^mnimax, 344, 393, 409, ... 

411 ^ívTí-ííz i~> í O- HfcP. 
Teoría de juegos, 377-414 
Teoría de von Neumann, 412 
Tetraedro, 158,471 
TFR. Véase Transformada de 
Fourier rápida 
Thorp, 412 

Transformación, 126-129, 131-136 
Transformación de semejanza, 
293-306 

Transformación identidad, 294 
Transformación lineal, 125-137 
Transformada de Fourier discreta, 
188, 189, 287 

Transformada de Fourier rápida 

(TFR), 188-197, 287, 372, 419, 
475, 477 

identidad fundamental, 287 
ortogonalidad, 188-197 
Traspuesta conjugada, 283 
Traza, 239-241, 243-244, 250-253 
Tukey, John, 194 

U 

Unicidad, 69 

V 

Valor característico cero, 109, 236, 
238, 241-243, 246, 488 
Valor del juego, 409 
Valores característicos diferentes de 
cero, 49 

Valores característicos distintos, 
245-247, 297-299, 303, 308, 
427, 473 

Valores característicos dobles, 246, 
422 

Valores característicos repetidos, 246 
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¿i .;Valores caracterfetieefs y vectores 
ARGSNTc'afacterísticos-, 233-309 
A\ 255-265 
cálculo, 359-366 
diagonalización, 245-254 
forma de Jordán, 300, 422 
inestabilidad, 234, 259, 270-273 
polinomio característico, 235 
matrices complejas, 280-292 
matriz positiva definida, 311 
prueba del valor característico, 320 
semejanza, 293-306 
valores característicos dobles, 

246, 422 

Variable de entrada, 387 
Variable de salida, 387 
Variable floja, 379, 383 
Variable libre, 80-85, 89-91, 94, 
104-109, 124, 384-387, 396, 
437-441, 477-481 
Varianzas y mínimos cuadrados 
ponderados, 169 
Vector, 2-9, 29-24 
Vector cero, 69 
Vector de costo, 382 
Vector error, 161-162, 165-167, 
170-172 

Vector unitario, 143, 174 
Vectores característicos 
generalizados, 268 
Vectores columna, 6-7, 20 
Vértice de un conjunto factible, 
381-391, 395-397 
Volumen, 201 

W 

Wilkinson, 355 
Wronskiano, 268 



Algebra lineal en pocas palabras 

(A es de n por n ) 

No singular Singular 

A es invertible. A no es invertible. 


Las columnas son independientes. 
Los renglones son independientes. 

El determinante es diferente de cero. 
Ax — 0 tiene una solución x — 0. 

Ax = b tiene una solución x = A~ l b. 

A tiene n pivotes (diferentes de cero). 

A tiene rango completo r = n. 

La forma escalonada reducida 
por renglones es R = I. 

El espacio columna es todo R". 

El espacio renglón es todo R". 

Todos los valores característicos son 
diferentes de cero. 

A T A es positiva definida simétrica. 


Las columnas son dependientes. 

Los renglones son dependientes. 

El determinante es cero. 

Ax = 0 tiene una infinidad de soluciones. 

Ax = b no tiene solución o tiene una 
infinidad de soluciones. 

A tiene r < n pivotes. 

A tiene rango r < n. 

R tiene por lo menos un renglón de ceros. 

La dimensión del espacio columna es r < n. 
El espacio renglón tiene dimensión r < n. 
Cero es un valor característico de A. 

A t A sólo es semidefmida. 


A tiene n valores singulares (positivos). A tiene r < n valores singulares. 
Cada recta de la columna singular puede hacerse cuantitativa usando r. 



